فينتك جيت:مصطفى عيد
كشف «Demis Hassabis»، الرئيس التنفيذي لشركة «Google DeepMind»، عن نية الشركة دمج نموذج الذكاء الاصطناعي متعدد المهام «Gemini» مع نموذج توليد الفيديو «Veo»، في خطوة تهدف إلى تعزيز فهم النماذج للواقع الفيزيائي المحيط، وتطوير ما وصفه بـ”المساعد الرقمي الشامل”.
وجاء تصريح حسّبيس خلال مشاركته في بودكاست Possible، الذي يقدمه مؤسس «LinkedIn» المشارك «ريد هوفمان»، حيث أشار إلى أن «Google» صممت نموذج «Gemini» منذ البداية ليكون متعدد الوسائط، مضيفًا: “نطمح إلى بناء مساعد رقمي حقيقي يساعد المستخدمين في العالم الواقعي، وليس فقط الافتراضي”.
ويشهد قطاع الذكاء الاصطناعي تحولاً تدريجياً نحو ما يُعرف بالنماذج “الشاملة” أو “الكلية”، القادرة على فهم وتوليف أشكال متعددة من الوسائط، مثل النصوص، والصور، والصوت، والفيديو.
وأطلقت «Google» مؤخراً نسخاً محدثة من «Gemini» يمكنها توليد الصوت والصور والنصوص، في حين طورت شركة «OpenAI» إمكانيات مماثلة في نموذج «ChatGPT»، شاملةً القدرة على إنتاج صور بأسلوب استوديو «Ghibli» الشهير.
كما أعلنت «Amazon» عن خطط لإطلاق نموذج “من أي شيء إلى أي شيء” في وقت لاحق من هذا العام.
وأشار حسّبيس إلى أن نموذج «Veo 2» يستفيد من كمٍّ هائل من بيانات الفيديو على منصة «YouTube»، التي تمتلكها «Google»، قائلاً: “من خلال مشاهدة الكثير من فيديوهات YouTube، يمكن للنموذج فهم فيزياء العالم الحقيقي”.
اقرا ايضا:
«جوجل» تستعد لأكبر تحديث في تاريخ محرك البحث باستخدام الذكاء الاصطناعي
«جوجل» تعتمد بروتوكول «Anthropic» لربط نماذج الذكاء الاصطناعي بمصادر البيانات
«جوجل» تستعد لإطلاق ميزتي «Canvas» و«Veo2» لإنشاء الفيديو ضمن نموذج «Gemini» للذكاء الاصطناعي
«جوجل» تطلق ميزات جديدة ومحسّنة في تطبيق «Gemini» لتعزيز تجربة المستخدم والتخصيص