الذكاء الاصطناعى ونماذج اللغة الكبيرة (LLMs) التي تعمل بها على الكثير من التطبيقات المفيدة ، ولكن على الرغم من وعدهم ، فهي ليست موثوقة للغاية.
لا أحد يعرف متى سيتم حل هذه المشكلة ، لذلك فمن المنطقي أننا نرى الشركات الناشئة تجد فرصة في مساعدة المؤسسات على التأكد من أن التطبيقات التي تدفعها LLM التي يدفعون مقابل العمل على النحو المقصود.
تشعر شركة بدء التشغيل التي تتخذ من لندن مقراً لها ، أن لديها برنامج Headstart في محاولة حل هذه المشكلة ، وذلك بفضل نماذجها المخصصة التي يمكن أن تساعد المؤسسات في تقييم دقة وجودة التطبيقات التي تعمل بها LLMs.
تشبه الشركة على غرار Agenta و Freeplay و HomeLoop و Langsmith ، والتي تدعي جميعها أنها توفر بديلاً أكثر صلابة ، قائم على LLM للاختبار البشري ، وقوائم التحقق من الأدوات القابلية للمراقبة. لكن Composo يدعي أنه مختلف لأنه يوفر خيار عدم الرمز و API. هذا أمر ملحوظ لأن هذا يوسع نطاق السوق المحتمل – ليس عليك أن تكون مطورًا لاستخدامه ، ويمكن لخبراء النطاق والمديرين التنفيذيين تقييم تطبيقات الذكاء الاصطناعى للتناقضات والجودة والدقة بأنفسهم.
في الممارسة العملية ، يجمع Composo بين نموذج المكافآت المدرب على الإخراج الذي يفضله الشخص أن يرى من تطبيق AI مع مجموعة محددة من critera محددة لهذا التطبيق لإنشاء نظام يقيم بشكل أساسي المخرجات من التطبيق مقابل هذه المعايير. على سبيل المثال ، يمكن أن يكون لدى chatbot الفرز الطبي إرشادات مخصصة لمجموعة العميل للتحقق من أعراض العلم الأحمر ، ويمكن أن يسجل Composo مدى استمرار التطبيق.
أطلقت الشركة مؤخرًا واجهة برمجة تطبيقات عامة لـ Composo Malign ، وهي نموذج لتقييم تطبيقات LLM على أي معايير.
يبدو أن الاستراتيجية تعمل إلى حد ما: إنها تحتوي على أسماء مثل Accenture و Palantir و McKinsey في قاعدة عملائها ، وقد جمعت مؤخرًا مليوني دولار في التمويل قبل البذرة. المبلغ الصغير الذي تم جمعه هنا ليس من غير المألوف بالنسبة لبدء التشغيل في مناخ المشاريع اليوم ، لكنه ملحوظ لأن هذه أرض الذكاء الاصطناعى ، بعد كل شيء – تمويل مثل هذه الشركات وفيرة.
ولكن وفقًا للمؤسس المشارك والمدير التنفيذي لشركة Composo ، Sebastian Fox ، فإن العدد المنخفض نسبيًا هو أن نهج بدء التشغيل ليس كثيفًا رأس المال.
وقال فوكس ، مستشار ماكينزي السابق: “على مدار السنوات الثلاث المقبلة على الأقل ، لا نتوقع أن نرفع مئات الملايين لأن هناك الكثير من الناس يقومون ببناء نماذج مؤسسة ويفعلون ذلك بفعالية كبيرة ، وهذا ليس USP لدينا”. “بدلاً من ذلك ، كل صباح ، إذا استيقظت وشاهدت قطعة أخبار قدمها Openai تقدمًا كبيرًا في نماذجهم ، فهذا أمر جيد لعملي.”
من خلال النقد الجديد ، تخطط Composo لتوسيع فريقها الهندسي (بقيادة المؤسس المشارك و CTO Luke Markham ، وهو مهندس تعليم آلي سابق في GraphCore) ، ويحصل على المزيد من العملاء وتعزيز جهود البحث والتطوير. وقال فوكس: “إن التركيز من هذا العام يدور حول تحجيم التكنولوجيا التي لدينا الآن عبر تلك الشركات”.
قادت شركة Twin Path Ventures Twin Path Ventures البريطانية ، التي شهدت أيضًا مشاركة من JVH Ventures و EWOR (دعمت الأخيرة بدء التشغيل من خلال برنامج التسريع الخاص بها). وقال متحدث باسم Twin Path في بيان “Composo يعالج عنق الزجاجة الحرجة في اعتماد مؤسسة AI”.
وقال فوكس إن عنق الزجاجة يمثل مشكلة كبيرة لحركة الذكاء الاصطناعي بشكل عام ، وخاصة في قطاع المؤسسة. “الناس أكثر من الضجيج من الإثارة ويفكرون الآن ،” حسنًا ، في الواقع ، هل هذا يغير حقًا أي شيء عن عملي في شكله الحالي؟ لأنها غير موثوقة بما فيه الكفاية ، وهي ليست متسقة بما فيه الكفاية. وحتى لو كان الأمر كذلك ، لا يمكنك إثبات لي كم هو “.
هذا عنق الزجاجة يمكن أن يجعل Composo أكثر قيمة للشركات التي ترغب في تنفيذ الذكاء الاصطناعي ولكن يمكن أن تتحمل المخاطر السمعة من القيام بذلك. يقول فوكس أن هذا هو السبب في أن شركته اختارت أن تكون غير ملائمة للصناعة ، ولكن لا يزال لديها صدى في الامتثال والرعاية القانونية والأمن.
أما بالنسبة إلى خندقها التنافسي ، فإن فوكس يشعر أن البحث والتطوير المطلوب للوصول إلى هنا ليس تافهة. وقال: “هناك بنية النموذج والبيانات التي استخدمناها لتدريبه” ، موضحًا أن Composo Moal تم تدريبه على “مجموعة بيانات كبيرة من تقييمات الخبراء”.
لا يزال هناك مسألة ما يمكن أن يفعله عمالقة التكنولوجيا إذا قاموا ببساطة بتخزين صناديق الحرب الضخمة لدخول هذه المشكلة ، لكن Composo يعتقد أن لديها ميزة المحرك الأول. “الآخر [thing] وقال فوكس في إشارة إلى كيفية قيام Composo ببناء تفضيلات التقييم: “البيانات التي نتراكمها بمرور الوقت”.
نظرًا لأنه يقوم بتقييم التطبيقات مقابل مجموعة مرنة من المعايير ، فإن Composo يرى أيضًا أن نفسه مناسب بشكل أفضل لصعود الذكاء الاصطناعى الوكيل من المنافسين الذين يستخدمون نهجًا أكثر تقييدًا. وقال فوكس: “في رأيي ، نحن بالتأكيد لسنا في المرحلة التي يعمل فيها الوكلاء بشكل جيد ، وهذا ما نحاول في الواقع المساعدة في حله”.
Source link
اكتشاف المزيد من مؤسسة اشراق العالم لتقنية المعلومات-خدمات مواقع ومتاجر الإنترنت
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.