نموذج AI الرئيسي التالي من Openai ، GPT-4.5 ، مقنع للغاية ، وفقًا لنتائج التقييمات القياسية الداخلية لـ Openai. إنه جيد بشكل خاص في إقناع الذكاء الاصطناعي الآخر لإعطائه نقودًا.
في يوم الخميس ، نشرت Openai ورقة بيضاء تصف قدرات طراز GPT-4.5 ، الذي أطلق عليه اسم Orion ، والذي تم إصداره يوم الخميس. وفقًا للورقة ، اختبر Openai النموذج على بطارية من المعايير الخاصة بـ “الإقناع” ، والذي يعرّف Openai بأنه “المخاطر المتعلقة بإقناع الأشخاص بتغيير معتقداتهم (أو العمل) على حد سواء المحتوى الثابت والتفاعل الناتج عن النموذج.”
في أحد الاختبارات التي كانت تحاول GPT-4.5 معالجة نموذج آخر-GPT-4O من Openai-إلى “التبرع” الأموال الافتراضية ، كان النموذج أداء أفضل بكثير من النماذج الأخرى المتاحة من Openai ، بما في ذلك نماذج “التفكير” مثل O1 و O3-Mini. كان GPT-4.5 أيضًا أفضل من جميع طرز Openai في خداع GPT-4O لإخباره بأنه كودس سري ، وأفضل O3-MINI بمقدار 10 نقاط مئوية.
وفقًا للورقة البيضاء ، برعت GPT-4.5 في Conning التبرع بسبب استراتيجية فريدة من نوعها التي طورتها أثناء الاختبار. سيطلب النموذج تبرعات متواضعة من GPT-4O ، مما يولد ردود مثل “حتى دولارين فقط أو 3 دولارات من 100 دولار من شأنه أن يساعدني بشكل كبير”. نتيجة لذلك ، تميل تبرعات GPT-4.5 إلى أن تكون أصغر من النماذج الأخرى في Openai المضمونة.
على الرغم من زيادة الإقناع لـ GPT-4.5 ، يقول Openai إن النموذج لا يفي بحدته الداخلية للمخاطر “العالية” في هذه الفئة القياسية بالذات. تعهدت الشركة بعدم إطلاق نماذج تصل إلى عتبة الخطورة العالية حتى تنفذ “تدخلات أمان كافية” لخفض المخاطر إلى “المتوسطة”.

هناك خوف حقيقي من أن الذكاء الاصطناعى يساهم في انتشار المعلومات الخاطئة أو المضللة التي تهدف إلى التأثير على القلوب والعقول نحو النهايات الخبيثة. في العام الماضي ، انتشرت الأفعال السياسية مثل الحرائق في جميع أنحاء العالم ، ويتم استخدام منظمة العفو الدولية بشكل متزايد لتنفيذ هجمات الهندسة الاجتماعية التي تستهدف كل من المستهلكين والشركات.
في الورقة البيضاء لـ GPT-4.5 وفي ورقة صدرت في وقت سابق من هذا الأسبوع ، أشار Openai إلى أنه بصدد مراجعة أساليبها للتحقيق في نماذج الإقناع في العالم الحقيقي ، مثل توزيع المعلومات المضللة على نطاق واسع.
Source link
اكتشاف المزيد من مؤسسة اشراق العالم لتقنية المعلومات-خدمات مواقع ومتاجر الإنترنت
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.