يبدو أن نظام AI الذي طورته Google DeepMind ، وهو مختبر أبحاث AI الرائد من Google ، تجاوز متوسط الميدالية الذهبية في حل مشاكل الهندسة في مسابقة رياضيات دولية.
النظام ، يسمى Alphageometry2 ، هو نسخة محسنة من نظام ، Alphageometry ، التي تم إصدارها DeepMind في يناير الماضي. في دراسة تم نشرها حديثًا ، يزعم الباحثون DeepMind وراء Alphageometry2 أن AI يمكنهم حل 84 ٪ من جميع مشاكل الهندسة على مدار الـ 25 عامًا الماضية في أولمبياد الرياضيات الدولي (IMO) ، وهي مسابقة رياضيات لطلاب المدارس الثانوية.
لماذا يهتم DeepMind بمسابقة الرياضيات على مستوى المدرسة الثانوية؟ حسنًا ، يعتقد المختبر أن مفتاح الذكاء الاصطناعى أكثر قدرة قد يكمن في اكتشاف طرق جديدة لحل مشاكل الهندسة الصعبة – وخاصة مشاكل الهندسة الإقليدية.
إن إثبات النظريات الرياضية ، أو شرح منطقيا لماذا نظرية (على سبيل المثال نظرية فيثاغوران) صحيحة ، يتطلب كل من التفكير والقدرة على الاختيار من بين مجموعة من الخطوات الممكنة نحو الحل. يمكن أن تكون مهارات حل المشكلات هذه-إذا كانت حق DeepMind-مكونًا مفيدًا في نماذج الذكاء الاصطناعي للأغراض العامة في المستقبل.
في الواقع ، في الصيف الماضي ، قام Deepmind بتوجيه نظام جمعه Alphageometry2 مع Alphaproof ، وهو نموذج منظمة العفو الدولية للمنطق الرسمي للرياضيات ، لحل أربع من أصل ستة مشكلات من IMO 2024. بالإضافة إلى مشاكل الهندسة ، يمكن تمديد مثل هذه الأساليب إلى مجالات أخرى من الرياضيات والعلوم – على سبيل المثال ، للمساعدة في الحسابات الهندسية المعقدة.
يحتوي Alphageometry2 على العديد من العناصر الأساسية ، بما في ذلك نموذج لغة من عائلة Gemini من Google من نماذج الذكاء الاصطناعي و “محرك رمزي”. يساعد نموذج الجوزاء على المحرك الرمزي ، الذي يستخدم القواعد الرياضية لاستنتاج حلول للمشاكل ، على الوصول إلى أدلة مجدية لنظرية هندسية معينة.
تعتمد مشاكل هندسة Olympiad على الرسوم البيانية التي تحتاج إلى “بنيات” لإضافتها قبل حلها ، مثل النقاط أو الخطوط أو الدوائر. يتنبأ نموذج Gemini في Alphageometry2 التي قد تكون مفيدة لإضافتها إلى رسم بياني ، يشير المحرك إلى إجراء خصومات.
في الأساس ، يقترح نموذج Gemini Alphageometry2 الخطوات والإنشاءات بلغة رياضية رسمية للمحرك ، والتي – بعد قواعد محددة – تتحقق من هذه الخطوات من أجل الاتساق المنطقي. تتيح خوارزمية البحث Alphageometry2 إجراء عمليات تفتيش متعددة عن حلول بالتوازي وتخزين نتائج مفيدة في قاعدة معرفة مشتركة.
يعتبر Alphageometry2 أن هناك مشكلة في حلها عندما تصل إلى دليل يجمع بين اقتراحات نموذج الجوزاء مع مبادئ المحرك الرمزي المعروفة.
بسبب تعقيدات ترجمة البراهين إلى تنسيق يمكن أن يفهمه منظمة العفو الدولية ، هناك ندرة في بيانات التدريب على الهندسة القابلة للاستخدام. قامت DeepMind بإنشاء بياناتها الاصطناعية الخاصة لتدريب نموذج لغة Alphageometry2 ، مما يولد أكثر من 300 مليون نظرية وإثبات من التعقيد المتغير.
اختار فريق DeepMind 45 مشكلة هندسية من مسابقات IMO على مدار الـ 25 عامًا الماضية (من 2000 إلى 2024) ، بما في ذلك المعادلات الخطية والمعادلات التي تتطلب أشياء هندسية نقل حول طائرة. ثم “ترجموا” هذه إلى مجموعة أكبر من 50 مشكلة. (لأسباب تقنية ، كان لا بد من تقسيم بعض المشكلات إلى قسمين.)
وفقًا للورقة ، حل Alphageometry2 42 من أصل 50 مشكلة ، مما أدى إلى مسح درجة الميدالية الذهبية البالغة 40.9.
منحت ، هناك قيود. يمنع Quirk الفني Alphageometry2 من حل المشكلات مع عدد متغير من النقاط والمعادلات غير الخطية وعدم المساواة. و Alphageometry2 ليس من الناحية الفنية أول نظام من الذكاء الاصطناعى يصل إلى أداء مستوى الذهب على مستوى الميدالية في الهندسة ، على الرغم من أنه أول من حققه مع مجموعة من هذا الحجم.
قام Alphageometry2 أيضًا بأسوأ سوءًا على مجموعة أخرى من مشاكل IMO الأكثر صعوبة. لتحدي إضافي ، اختار فريق DeepMind المشكلات – 29 في المجموع – التي تم ترشيحها لامتحانات IMO من قبل خبراء الرياضيات ، لكن ذلك لم يظهر بعد في مسابقة. Alphageometry2 يمكن أن يحل فقط 20 من هذه.
ومع ذلك ، من المرجح أن تتغذى نتائج الدراسة على ما إذا كان ينبغي بناء أنظمة الذكاء الاصطناعى على معالجة الرموز-أي معالجة الرموز التي تمثل المعرفة باستخدام القواعد-أو الشبكات العصبية الأكثر شبيهة بالدماغ.
تعتمد Alphageometry2 نهجًا مختلطًا: يحتوي نموذج الجوزاء على بنية شبكة عصبية ، في حين أن محركه الرمزي يعتمد على القواعد.
يجادل مؤيدو تقنيات الشبكة العصبية بأن السلوك الذكي ، من التعرف على الكلام إلى توليد الصور ، يمكن أن يخرجوا من لا شيء أكثر من كميات هائلة من البيانات والحوسبة. مقابل الأنظمة الرمزية ، التي تحل المهام من خلال تحديد مجموعات من قواعد المعالجة الرمزية المخصصة لوظائف معينة ، مثل تحرير خط في برنامج معالج النصوص ، تحاول الشبكات العصبية حل المهام من خلال التقريب الإحصائي والتعلم من أمثلة.
الشبكات العصبية هي حجر الزاوية في أنظمة الذكاء الاصطناعى القوية مثل نموذج “التفكير” Openai. لكن ، مطالبة مؤيدي الذكاء الاصطناعى الرمزي ، إنهم ليسوا كلهم ؛ قد يكون موقع AI الرمزي في وضع أفضل لترميز معرفة العالم بكفاءة ، ويسبب طريقهم من خلال السيناريوهات المعقدة ، و “شرح” كيف وصلوا إلى إجابة ، كما يجادل هؤلاء المؤيدون.
“من المذهل أن نرى التباين بين التقدم المستمر والمذهل في هذه الأنواع من المعايير ، وفي الوقت نفسه ، نماذج اللغة ، بما في ذلك النماذج الأكثر حداثة مع” التفكير “، والاستمرار في الصراع مع بعض مشاكل العموم البسيطة” ، فينس كونيتزر ، وهو كارنيجي ميلون أستاذ علوم الكمبيوتر الجامعي المتخصص في الذكاء الاصطناعي ، أخبر TechCrunch. “لا أعتقد أن كل ذلك كله دخان ومرايا ، لكنه يوضح أننا لا نزال نعرف حقًا السلوك الذي يمكن توقعه من النظام التالي. من المحتمل أن تكون هذه الأنظمة مؤثرة للغاية ، لذلك نحتاج بشكل عاجل إلى فهمها والمخاطر التي تشكلها أفضل بكثير. “
ربما يوضح Alphageometry2 أن النهجين – التلاعب الرمزي والشبكات العصبية – مجموع هي مسار واعد إلى الأمام في البحث عن الذكاء الاصطناعى القابلة للتعميم. في الواقع ، وفقًا لورقة DeepMind ، لم تستطع O1 ، والتي لديها أيضًا بنية الشبكة العصبية ، حل أي من مشاكل IMO التي تمكنت Alphageometry2 من الإجابة.
قد لا يكون هذا هو الحال إلى الأبد. في الورقة ، قال فريق DeepMind إنه وجد دليلًا أوليًا على أن نموذج لغة Alphageometry2 كان قادرًا على توليد حلول جزئية للمشاكل دون مساعدة من المحرك الرمزي.
“[The] تدعم النتائج الأفكار التي يمكن أن تكون نماذج اللغة الكبيرة مكتفية ذاتيا دون الاعتماد على الأدوات الخارجية [like symbolic engines]كتب فريق DeepMind في الورقة ، “ولكن حتى [model] تم تحسين السرعة وتحل الهلوسة بالكامل ، ستبقى الأدوات ضرورية لتطبيقات الرياضيات. “
Source link
اكتشاف المزيد من مؤسسة اشراق العالم لتقنية المعلومات-خدمات مواقع ومتاجر الإنترنت
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.