أعلنت شركة غوغل عن إطلاق «3 Veo»، وهو مولّد فيديوهات بالذكاء الاصطناعي قادر على إنشاء الفيديوهات ودمج الصوت فيها أيضاً.

ويُعد هذا الابتكار منافسًا مباشراً لأداة «Sora» التابعة لـ OpenAI، إلا أن ما يميّزه هو قدرته على إدخال عناصر صوتية ضمن الفيديو، بما في ذلك الحوارات بين الشخصيات وأصوات الحيوانات.

تُظهر مقاطع الفيديو المنتَجة باستخدام «3 Veo» واقعية لدرجة أن معظم المستخدمين عبر الإنترنت لا يمكنهم تمييزها عن الأعمال التي ينفذها صانعو الأفلام والممثلون البشريون.

وقد أذهلت المقاطع التي نُشرت عبر الإنترنت المشاهدين بواقعيتها، وأثارت في الوقت ذاته مشاعر قلق من ضياع الحدود بين الحقيقي والمزيّف.

وعلى خلاف أداة «Sora» من OpenAI، التي طُرحت بشكل أوسع في ديسمبر الماضي، يتميز «3 Veo» من DeepMind – الذراع البحثية لغوغل – بقدرته على إدراج الحوارات، والمقاطع الموسيقية، والمؤثرات الصوتية ضمن الفيديوهات.

يتفوّق النموذج في استجابته للتعليمات المعقّدة، ويترجم الأوصاف التفصيلية إلى مشاهد واقعية.

كما يلتزم بمحاكاة قوانين الفيزياء الطبيعية، ويوفّر مزامنة دقيقة لحركة الشفاه، ويحافظ على تسلسل منطقي للأحداث، ويُنتج شخصيات بملامح بشرية واقعية، بما في ذلك الأيدي بخمسة أصابع.

وبحسب الأمثلة التي عرضتها غوغل وتلك التي نُشرت عبر الإنترنت، فإن المؤشرات المعتادة التي تدل على أن المحتوى صناعي باتت شبه غائبة.

لطالما ساهمت تقنيات المؤثرات الخاصة، وتطبيقات تحرير الفيديو، وتطور الكاميرات في تغيير ملامح صناعة السينما في هوليوود، لكن الأفلام المُنتجة بالذكاء الاصطناعي تمثل تحدياً جديداً وفريداً أمام صناع المحتوى البشري.

وفي مقطع ترويجي لأداة «Flow» الجديدة من غوغل، والتي تتضمن تقنية «3 Veo»، صرّح عدد من صانعي الأفلام بأن هذه التقنية تمنحهم حرية إبداعية جديدة لكنها تحمل في طياتها شعوراً غامضاً بالاستقلالية الآلية.

من جهة أخرى، يستخف بعض النقّاد بأي فيديو من إنتاج الذكاء الاصطناعي ويصفونه بـ«الرديء»، بغض النظر عن جودته التقنية أو واقعيته، غير أن الكاتبة «إينا فريد» من موقع Axios تشير إلى أن تقييم هذا النوع من المحتوى يظل أمراً ذاتياً يختلف من شخص لآخر.

وقد تكون هذه الأداة مفيدة أيضًا في مجالات التسويق والإنتاج الإعلامي التجاري، وفقاً لما ذكره عدد من محللي الذكاء الاصطناعي. ومع ذلك، لا تزال طريقة تدريب «3 Veo» غير واضحة، كما أن تأثيرها على الإبداع الفني للمخرجات ما زال محل تساؤل.

وفي سياق متصل، أعلنت غوغل عن إطلاق «4 Imagen»، وهو أحدث أدواتها لتوليد الصور، والذي يوفر جودة صور أعلى من خلال أوامر المستخدمين.

كما كشفت عن أداة «Flow»، وهي أداة جديدة لصناعة الأفلام تتيح للمستخدمين إنشاء مقاطع سينمائية من خلال وصف المواقع، وزوايا التصوير، والتفضيلات الأسلوبية.

يمكن الوصول إلى هذه الأداة من خلال منصات Gemini وWhisk وVertex AI وWorkspace.

يُذكر أن سجل غوغل في مجال مولدات الصور بالذكاء الاصطناعي متباين؛ إذ اضطرت العام الماضي إلى إعادة إطلاق أداة «3 Imagen» بعد أن أثارت نتائجها انتقادات واسعة نتيجة تقديم صور غير دقيقة تاريخياً استناداً إلى أوامر المستخدمين