في يوم الثلاثاء ، أصدرت Openai أدوات جديدة مصممة لمساعدة المطورين والمؤسسات على بناء وكلاء الذكاء الاصطناعي – الأنظمة الآلية التي يمكنها تحقيق المهام بشكل مستقل – باستخدام نماذج وأطر الذكاء الاصطناعي الخاص للشركة.
تعد الأدوات جزءًا من API الجديدة من Openai ، والتي تتيح للشركات تطوير وكلاء AI مخصصين يمكنهم إجراء عمليات البحث على الويب ، والمسح الضوئي من خلال ملفات الشركة ، والتنقل في مواقع الويب ، مثل منتج مشغل Openai. تستبدل API API بشكل فعال API المساعدون في Openai ، والتي تخطط الشركة لغروب الشمس في النصف الأول من عام 2026.
نمت الضجيج حول وكلاء الذكاء الاصطناعى بشكل كبير في السنوات الأخيرة على الرغم من حقيقة أن صناعة التكنولوجيا قد ناضلت لإظهار الناس ، أو حتى تعريف “وكلاء الذكاء الاصطناعى” حقًا. في أحدث مثال على الضجيج العامل الذي يمتد قبل الأداة ، أصبح تأثير الفراشة الصيني في وقت سابق من هذا الأسبوع في منصة وكيل AI جديدة تسمى Manus والتي اكتشفها المستخدمون بسرعة على العديد من وعود الشركة.
وبعبارة أخرى ، فإن المخاطر عالية بالنسبة لـ Openai للحصول على الوكلاء بشكل صحيح.
وقال أوليفييه جوديمونت ، رئيس منتجات API في Openai ، لـ TechCrunch في مقابلة: “من السهل جدًا عرض وكيلك”. “لتوسيع نطاق الوكيل أمر صعب للغاية ، ولجعل الناس يستخدمونه في كثير من الأحيان أمر صعب للغاية.”
في وقت سابق من هذا العام ، قدم Openai وكيلين من الذكاء الاصطناعى في ChatGpt: المشغل ، الذي يتنقل على مواقع الويب نيابة عنك ، والبحث العميق ، الذي يجمع التقارير البحثية لك. عرضت كلتا الأداة لمحة عن ما يمكن أن تحققه التكنولوجيا الوالدين ، لكنهما تركا بعض الشيء المطلوب في قسم “الحكم الذاتي”.
الآن مع استجابات API ، يريد Openai بيع الوصول إلى المكونات التي تعمل على تشغيل وكلاء الذكاء الاصطناعي ، مما يسمح للمطورين ببناء تطبيقات عوامل على طراز البحث العميق. يأمل Openai أن يتمكن المطورون من إنشاء بعض التطبيقات مع تقنية الوكيل التي تشعر بأنها أكثر استقلالية مما هو متاح اليوم.
باستخدام واجهة برمجة تطبيقات الردود ، يمكن للمطورين النقر على نماذج الذكاء الاصطناعى نفسها (في المعاينة) تحت غطاء محرك أداة البحث على الويب في Openai: GPT-4O Search و GPT-4O Mini Search. يمكن للنماذج تصفح الويب للحصول على إجابات للأسئلة ، مستشهدة بمصادر لأنها تولد ردود.
يدعي Openai أن بحث GPT-4O و GPT-4O Mini دقيقان بشكل كبير. على معيار الشركة البسيط ، الذي يقيس قدرة النماذج على الإجابة على الأسئلة القصيرة التي تسعى للوقائع ، فإن نتائج البحث GPT-4O تسجل 90 ٪ في حين أن GPT-4O Mini Search Scarts 88 ٪ (أعلى أفضل). للمقارنة ، فإن GPT-4.5-طراز Openai الأكبر الذي تم إصداره مؤخرًا-يسجل 63 ٪ فقط.
إن حقيقة أن أدوات البحث التي تعمل بالنيابة أكثر دقة من نماذج الذكاء الاصطناعى التقليدية ليست بالضرورة مفاجئة-من الناحية النظرية ، يمكن أن يبحث البحث عن GPT-4O عن الإجابة الصحيحة. ومع ذلك ، فإن البحث على الويب لا يجعل الهلوسة مشكلة حلول. إلى جانب دقتها الواقعة ، تميل أدوات البحث من الذكاء الاصطناعي أيضًا إلى الكفاح من خلال استفسارات قصيرة من الملاحة (مثل “Lakers Score Today”) ، وتشير التقارير الحديثة إلى أن استشهادات Chatgpt ليست دائمًا موثوقة.
تتضمن API الردود أيضًا أداة بحث للملفات التي يمكنها المسح الضوئي بسرعة عبر الملفات في قواعد بيانات الشركة لاسترداد المعلومات. (يدعي Openai أنه لن يقوم بتدريب النماذج على هذه الملفات.) بالإضافة إلى ذلك ، يمكن للمطورين الذين يستخدمون استجابات API النقر على نموذج عامل استخدام الكمبيوتر Openai ، والذي يعمل على تشغيل المشغل. يقوم النموذج بإنشاء إجراءات الماوس ولوحة المفاتيح ، مما يسمح للمطورين بأتمتة استخدام الكمبيوتر مثل إدخال البيانات وسير عمل التطبيق.
وقال Openai إنه يمكن للمؤسسات تشغيل نموذج CUA اختياريًا ، والذي يتم إطلاقه في معاينة البحث ، محليًا على أنظمتها الخاصة. لا يمكن لنسخة المستهلك من CUA المتوفرة في المشغل اتخاذ إجراءات على الويب فقط.
لتوضيح ذلك ، لن تحل API الردود جميع المشكلات التقنية التي تعاني من وكلاء الذكاء الاصطناعى اليوم.
على الرغم من أن أدوات البحث التي تعمل بالنيابة أكثر دقة من نماذج الذكاء الاصطناعى التقليدية-وهي حقيقة غير مفاجئة بالنظر إلى أنها يمكن أن تبحث عن الإجابة الصحيحة فقط-لا يجعل البحث على الويب هلوسة منظمة العفو الدولية مشكلة تم حلها. لا يزال البحث GPT-4O يخطئ 10 ٪ من الأسئلة الواقعية. إلى جانب دقتها ، تميل أدوات البحث من الذكاء الاصطناعى أيضًا إلى الكفاح من خلال استفسارات قصيرة من الملاحة (مثل “Lakers Score Today”) ، وتشير التقارير الحديثة إلى أن استشهادات ChatGPT ليست موثوقة دائمًا.
في منشور مدونة تم توفيره لـ TechCrunch ، قال Openai إن نموذج CUA “ليس موثوقًا به بعد لأتمتة المهام في أنظمة التشغيل” ، وأنه عرضة لارتكاب الأخطاء “غير المقصودة”.
ومع ذلك ، قال Openai إن هذه تكرارات مبكرة لأدوات وكيلهم ، وهي تعمل باستمرار على تحسينها.
إلى جانب API الردود ، تصدر Openai مجموعة أدوات مفتوحة المصدر تسمى الوكلاء SDK ، والتي توفر للمطورين أدوات مجانية لدمج النماذج مع أنظمةهم الداخلية ، ووضع ضمانات ، ومراقبة أنشطة وكيل AI لأغراض تصحيح الأخطاء والتحسين. الوكلاء SDK هو متابعة من نوع ما إلى Openai’s Swarm ، وهو إطار لتنسيق متعدد الوكلاء أصدرته الشركة في أواخر العام الماضي.
قال جوديمونت إنه يأمل أن يتمكن Openai من سد الفجوة بين عروض AI Agent والمنتجات هذا العام ، وهذا ، في رأيه ، “الوكلاء هم أكثر تطبيقات منظمة العفو الدولية التي ستحدث”. هذا يردد الرئيس التنفيذي لشركة Openai Sam Altman في يناير: أن عام 2025 هو العام الذي يدخل فيه وكلاء الذكاء الاصطناعى القوى العاملة.
سواء أكان عام 2025 أصبحت حقًا “سنة وكيل الذكاء الاصطناعى” ، تظهر أحدث إصدارات Openai أن الشركة تريد التحول من عروض العروض الوهمية المبهجة إلى الأدوات المؤثرة.
Source link
اكتشاف المزيد من مؤسسة اشراق العالم لتقنية المعلومات-خدمات مواقع ومتاجر الإنترنت
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.