tech

لا يمكنني تحمل تكاليف مشغل chatgpt ، لذلك أنا أستخدم هذا البديل المجاني المفتوح المصدر بدلاً من ذلك

لم يعد وكلاء الذكاء الاصطناعى الذين يمكنهم التحكم في متصفح الويب وأداء المهام ، تمامًا مثل البشر ، يقتصرون على المفهوم. أدوات مثل مشغل ChatGPT قوية ولكنها تأتي بسعر. بدلاً من الدفع ، ذهبت للبحث عن بديل مجاني – ووجدت بديلًا جيدًا بشكل مدهش.

استخدام المتصفح: أفضل بديل مفتوح المصدر وجدته

يمكن لمشغل ChatGPT التحكم في متصفح الويب وإجراء إجراءات مثل النقر والتمرير بنفسه. عليك فقط إخبار ChatGPT بما يجب القيام به ، مثل حجز تذاكر أو كتابة نص في مستندات Google ، وسوف يفعل ذلك. ولكن للوصول ، يتعين على المرء أن يدفع سعرًا كبيرًا – 200 دولار شهريًا كجزء من THEAGPT's Pro Tier. لم أستطع شراء هذا الاشتراك ، وخرجت بحثًا عن بديل ووجدت حول استخدام المتصفح.

متعلق ب

ما هم وكلاء الذكاء الاصطناعى وكيف يعملون؟

يمكن أن يساعدك وكلاء الذكاء الاصطناعي في حل المشكلات المعقدة ، ولكن كيف يعملون بالفعل؟

استخدام المتصفح هو وكيل AI مفتوح المصدر يشبه مشغل ChatGPT. يمكن أن يتفاعل مع متصفح الويب ، والتنقل عبر مواقع الويب ، وإجراء الإجراءات. ومع ذلك ، فإنه يكلف فقط جزء صغير من عروض ChatGpt. علاوة على ذلك ، هناك خياران للاختيار من بينها.

الخيار الأول هو دفع اشتراك بقيمة 30 دولارًا ، والذي يدير وكيل الذكاء الاصطناعي على الخدمة السحابية. الخيار الآخر هو إعداده بنفسك محليًا ، ويكلفه أقل ما يكلف (لن يتم فرض رسوم إلا لاستخدام API). ذهبت مع الخيار الأكثر بأسعار معقولة.

إن إعداد استخدام المستعرض ليس واضحًا مثل مشغل ChatGPT ، ولكن مع بضعة أسطر من التعليمات البرمجية ، قمت بتشغيله. إذا كان بإمكاني القيام بذلك ، يمكنك أيضًا!

كيف قمت بإعداد استخدام المستعرض على جهاز الكمبيوتر الخاص بي

للبدء ، ستحتاج إلى شيئين: Python 3.11 مثبت على جهاز الكمبيوتر الخاص بك والوصول إلى واجهة برمجة التطبيقات من Openai (أو LLM المستضافة محليًا إذا كنت تفضل ذلك).

نظرًا لأن استخدام المتصفح هو عامل منظمة العفو الدولية ، فإنه يتطلب نموذج لغة كبير (LLM) للعمل. لذلك ، يمكنك الوصول إلى API من موقع Openai على الويب أو أي واجهة برمجة تطبيقات أخرى تعمل مع استخدام المتصفح. تتمثل فائدة استخدام واجهة برمجة التطبيقات في أن تحصل على المرونة للاختيار بين النماذج المختلفة (مثل GPT-3.5 و GPT-4) ، وعليك فقط دفع ثمن ما تستخدمه-لرسوم الاشتراك مقدمًا.

في الاختبار الخاص بي ، استخدمت طراز ChatGPT 4-O. تم فرض رسوم على أقل من دولار واحد لجميع المهام السبعة التي طلبت من استخدام المتصفح لأداءها. ومع ذلك ، إذا قمت بإقرانها باستخدام API Deepseek ، فسيكون ذلك أرخص عدة مرات.

يمكنك أيضًا استخدام LLM محلي على جهاز الكمبيوتر الخاص بك. ومع ذلك ، فإن تشغيل LLM محلي مماثل لـ ChatGPT 4-O يتطلب قوة حوسبة كبيرة ، والتي من المحتمل ألا يكون لدى معظم الناس. لقد اختبرت طراز 7B LLM من Deepseek على جهاز الكمبيوتر الخاص بي ، وكان الأداء سيئًا بشكل غير مفاجئ. لذلك ، أود أن أوصي بالالتزام مع واجهة برمجة التطبيقات في الوقت الحالي.

بمجرد الحصول على وصول API ، يمكنك إنشاء بيئة افتراضية في VS Code من خلال الذهاب إلى العرض> لوحة القيادة والكتابة خلق بيئة. ثم ، افتح محطة جديدة وقم بتثبيت استخدام المتصفح باستخدام PIP.

        pip install browser-use
    

قم بإنشاء ملف .env داخل المجلد وأضف مفتاح API الخاص بك.

        OPENAI_API_KEY="Your API Here"
    

قم بإنشاء ملف Python جديد بالاسم app.py ولصق الرمز التالي.

        pip install browser-use
OPENAI_API_KEY="Your API Here"
from langchain_openai import ChatOpenAI

from browser_use import Agent

import asyncio

from dotenv import load_dotenv

load_dotenv()



async def main():

    agent = Agent(

        task="Go to Reddit, search for 'browser-use', click on the first post and return the first comment.",

        llm=ChatOpenAI(model="gpt-4o"),

    )

    result = await agent.run()

    print(result)



asyncio.run(main())

استبدل المطالبة الخاصة بك ، مثل “ابحث عن ألبرت أينشتاين وفتح صفحته ويكيبيديا.” أخيرًا ، قم بتشغيل ملف App.py Python باستخدام المحطة.

        python app.py
    

وضعه في الاختبار: هل ترقى إلى مستوى التوقعات؟

لقد بدأت الاختبار بمهام بسيطة ، مثل Googling “Albert Einstein” وفتح صفحته Wikipedia. عندما قمت بتشغيل البرنامج النصي ، فتح وكيل الذكاء الاصطناعى نافذة متصفح جديدة ونفذ المهمة بلا عيب.

بعد ذلك ، طلبت ذلك للبحث عن أجهزة الكمبيوتر المحمولة للألعاب على Amazon وفتح النتيجة الأولى. مرة أخرى ، أكمل وكيل الذكاء الاصطناعي المهمة بنجاح.

في هذه المرحلة ، كنت مقتنعا بأن استخدام المتصفح يمكن أن يتنقل بذكاء على الويب. لدفعه إلى أبعد من ذلك ، أمرت ذلك بزيارة Yahoo News وتلخيص أفضل خمسة مقالات. لدهشتي ، يمكن لاستخدام المستعرض إكمال المهمة في غضون بضع دقائق. كانت الملخصات قصيرة وإلى هذه النقطة. يمكنك رؤية النتائج أدناه.

ومع ذلك ، أصبحت الأمور صعبة لاستخدام المتصفح عندما طلبت ذلك للبحث عن رحلات من لندن إلى باريس على موقع Skyscanner.com. في البداية ، قام موقع الويب بحظر الوصول بسبب اكتشاف الروبوت ، لذلك اضطررت إلى التدخل وتجاوز اكتشاف الروبوت. ومع ذلك ، فإن المستعرض يستخدم يكافح – لقد نقر على زر البحث دون إدخال “لندن” و “باريس” بشكل صحيح في الحقول المعنية.

يمكنك إقران استخدام المتصفح مع متصفحك الرئيسي ، حيث يتم تسجيل جميع حساباتك. يتيح ذلك لوكيل الذكاء الاصطناعى إدخال البيانات في ورقة Google أو لصق ملخصات أخبار Yahoo في مستند Google. ومع ذلك ، واجهت مشكلات في إعدادها مع متصفحي النشط ، لذلك أوقفته في الوقت الحالي.

وعموما ، كانت تجربة ممتعة. كانت مشاهدة وكيل الذكاء الاصطناعى تنقل الويب وأداء المهام رائعة. على الرغم من أن استخدام المتصفح ليس مثاليًا ، إلا أنه بعيد عن وكيل الذكاء الاصطناعي الصلب الذي يمكنه تصفح الويب.

ومع ذلك ، فإن هذه التكنولوجيا في مهدها ، لذلك يمكننا توقع تحسينات في المستقبل.

في الوقت الحالي ، إذا كنت على استعداد للعبور مع الإعداد ولا تمانع في الفواق العرضي ، فقم بتشغيل جهاز الكمبيوتر الخاص بك وتثبيت استخدام المتصفح. لا تتردد في ذكرها في المواضيع إذا تعثرت وتحتاج إلى يد المساعدة.

مقالات ذات صلة

زر الذهاب إلى الأعلى

أنت تستخدم إضافة Adblock

برجاء دعمنا عن طريق تعطيل إضافة Adblock