أصدرت شركة التكنولوجيا الصينية Alibaba يوم الاثنين QWEN3 ، وهي عائلة من طرازات الذكاء الاصطناعى التي تطالب بها الشركة ، وفي بعض الحالات تتفوق على أفضل النماذج المتاحة من Google و Openai.
تتوفر معظم النماذج – أو ستكون قريبًا – للتنزيل بموجب ترخيص “مفتوح” من منصة AI Dev Hugging Face و Github. وهي تتراوح حجمها من 0.6 مليار معلمة إلى 235 مليار معلمة. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات في النموذج ، وتؤدي النماذج ذات المعلمات بشكل عام بشكل أفضل من تلك التي تحتوي على معلمات أقل.
زاد ارتفاع سلسلة النماذج المصنوعة من الصين مثل Qwen من الضغط على المختبرات الأمريكية مثل Openai لتقديم تقنيات الذكاء الاصطناعى أكثر قدرة. لقد قادوا أيضًا صناع السياسة إلى تنفيذ قيود تهدف إلى الحد من قدرة شركات الذكاء الاصطناعى الصينيين على الحصول على الرقائق اللازمة لتدريب النماذج.
تقديم QWEN3!
نقوم بإطلاق و QWEN3 مفتوح الوزن ، وأحدث نماذج اللغة الكبيرة لدينا ، بما في ذلك نماذج 2 MOE و 6 طرز كثيفة ، تتراوح من 0.6B إلى 235B. يحقق نموذجنا الرئيسي ، QWEN3-235B-A22B ، نتائج تنافسية في تقييمات قياسية للترميز ، الرياضيات ، عام … pic.twitter.com/jwzkjehwhc
– Qwen (alibaba_qwen) 28 أبريل 2025
وفقًا لأبابا ، فإن نماذج QWEN3 عبارة عن نماذج “هجينة” ، بمعنى أنها قد تستغرق بعض الوقت و “العقل” من خلال المشكلات المعقدة أو الإجابة على الطلبات الأكثر بساطة. يمكّن التفكير النماذج من التحقق بشكل فعال من الحقائق ، على غرار نماذج مثل Openai’s O3 ، ولكن على حساب الكمون الأعلى.
وكتب فريق Qwen في منشور مدونة: “لدينا أنماط تفكير ومدمجة بسلاسة ، ونقدم للمستخدمين المرونة للتحكم في ميزانية التفكير”. “يمكّن هذا التصميم المستخدمين من تكوين ميزانيات خاصة بالمهمة بسهولة أكبر.”
تتبنى بعض النماذج أيضًا مزيجًا من بنية الخبراء (MOE) ، والتي يمكن أن تكون أكثر فعالية من الناحية الحسابية للرد على استعلامات. ينقسم Moe المهام إلى المهام الفرعية ويفوضها إلى نماذج “خبراء” أصغر متخصصة.
يقول علي بابا إن طرازات QWEN3 تدعم 119 لغة ، وتم تدريبها على مجموعة بيانات تبلغ حوالي 36 تريليون رمزًا. الرموز هي البتات الخام من البيانات التي يعالجها النموذج ؛ مليون الرموز تعادل حوالي 750،000 كلمة. يقول Alibaba أن QWEN3 تم تدريبه على مجموعة من الكتب المدرسية ، و “أزواج الإجابة عن الأسئلة” ، ومقتطفات التعليمات البرمجية ، والبيانات التي يتم إنشاؤها من الذكاء الاصطناعي ، وأكثر من ذلك.
هذه التحسينات ، إلى جانب الآخرين ، عززت بشكل كبير قدرات QWEN3 مقارنة بسلفها ، QWEN2 ، يقول علي بابا. لا يوجد أي من طرز QWEN3 من الرأس والكتفين فوق الطرز الحديثة من أعلى الخط مثل Openai’s O3 و O4-MINI ، لكنهم مع ذلك فنانين أقوياء.
على Codeforces ، منصة لمسابقات البرمجة ، فإن أكبر طراز QWEN3-QWEN-3-235B-A22B-يتفوق على Openai’s O3-Mini و Google’s Gemini 2.5 Pro. QWEN-3-235B-A22B أيضًا أفضل O3-MINI على أحدث إصدار من AIME ، وهو معيار للرياضيات الصعبة ، و BFCL ، وهو اختبار لتقييم قدرة النموذج على “التفكير” حول المشكلات.
لكن QWEN-3-235B-A22B غير متاح للجمهور-على الأقل ليس بعد.
لا يزال أكبر نموذج QWEN3 العام ، QWEN3-32B ، قادرًا على المنافسة مع عدد من نماذج الذكاء الاصطناعى الملكية والمفتوحة ، بما في ذلك R1 الصينية AI Lab Deepseek. QWEN3-32B يتجاوز نموذج Openai O1 في العديد من الاختبارات ، بما في ذلك المعيار الترميز LiveCodeBench.
يقول Alibaba إن QWEN3 “Excels” في إمكانات استدعاء الأدوات بالإضافة إلى اتباع الإرشادات ونسخ تنسيقات بيانات محددة. بالإضافة إلى نماذج التنزيل ، يتوفر QWEN3 من مقدمي الخدمات السحابية ، بما في ذلك الألعاب النارية AI و Vistrolic.
قال Tuhin Srivastava ، المؤسس المشارك والرئيس التنفيذي لشركة AI Cloud Host Baseten ، إن QWEN3 هو نقطة أخرى في خط الاتجاه للنماذج المفتوحة مواكبة أنظمة المصدر المغلقة مثل Openai.
وقال لـ TechCrunch: “تتضاعف الولايات المتحدة تقييد مبيعات الرقائق في الصين والمشتريات من الصين ، ولكن نماذج مثل Qwen 3 التي هي حديثة ومفتوحة … سيتم استخدامها بلا شك محليًا”. “إنه يعكس حقيقة أن الشركات على حد سواء تقوم ببناء أدواتها الخاصة [as well as] شراء الرف عبر شركات طراز مغلق مثل الأنثروبور و Openai. “
اكتشاف المزيد من مؤسسة اشراق العالم لتقنية المعلومات-خدمات مواقع ومتاجر الإنترنت
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.