في ظهور حديث حول ممكن ، قال ديميس هاسابيس ، الرئيس التنفيذي لشركة Google Deepmind ، الرئيس التنفيذي لشركة Google Deepmind ، إن Google تخطط في نهاية المطاف بين نماذج Gemini AI مع نماذج توليد الفيديو في Google Deepmind ، إن Google تخطط في نهاية المطاف بين نماذج Gemini AI ونماذج توليد الفيديو في Veo لتحسين فهم السابق للعالم المادي.
قال حاسابيس: “لقد بنينا دائمًا الجوزاء ، نموذج الأساس الخاص بنا ، ليكون متعدد الوسائط منذ البداية ، والسبب في أننا فعلنا ذلك [is because] لدينا رؤية لهذه الفكرة عن مساعد رقمي عالمي ، مساعد … يساعدك بالفعل في العالم الحقيقي. “
تتحرك صناعة الذكاء الاصطناعى تدريجياً نحو نماذج “Omni” ، إذا صح التعبير – نماذج يمكنها فهم العديد من أشكال الوسائط وتوليفها. يمكن لأحدث نماذج Gemini من Google إنشاء صوت بالإضافة إلى صور ونص ، في حين أن النموذج الافتراضي لـ Openai في ChatGPT يمكنه إنشاء صور-بما في ذلك ، بالطبع ، فن Studio Ghibli-Style. أعلنت Amazon أيضًا عن خطط لإطلاق نموذج “من أجل أي شخص” في وقت لاحق من هذا العام.
تتطلب هذه النماذج Omni الكثير من بيانات التدريب – الصور ، ومقاطع الفيديو ، والصوت ، والنص ، وما إلى ذلك. إن Hassabis ضمنيًا أن بيانات الفيديو الخاصة بـ VEO تأتي في الغالب من YouTube ، وهي منصة تمتلكها Google.
“في الأساس ، من خلال مشاهدة مقاطع فيديو YouTube – الكثير من مقاطع الفيديو على YouTube – [Veo 2] وقال هاسابيس: “يمكن معرفة ، كما تعلمون ، فيزياء العالم”.
أخبرت Google من قبل TechCrunch نماذجها “قد تكون” تدرب على “بعض” محتوى YouTube وفقًا لاتفاقها مع منشئي YouTube. وبحسب ما ورد ، وسعت Google شروط الخدمة العام الماضي جزئيًا للسماح للشركة بالضغط على المزيد من البيانات لتدريب نماذج الذكاء الاصطناعي.
Source link
اكتشاف المزيد من مؤسسة اشراق العالم لتقنية المعلومات-خدمات مواقع ومتاجر الإنترنت
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.