كشفت شركة Google DeepMind عن نموذجها الجديد Genie 3، والذي يحقق نقلة نوعية في رحلة تطوير الذكاء الاصطناعي نحو مستوى أكثر تطورًا وواقعية، يعرف بـ الذكاء الاصطناعي العام (AGI)، أي ذلك القادر على التفكير والتعلم بصورة مشابهة للعقل البشري.

ما الذي يميز Genie 3؟

أعلن شلومي فروختر، مدير الأبحاث في ديب مايند، أن Genie 3 يمثل أول نموذج تفاعلي لحظي وعام في آنٍ واحد، وعلى عكس النماذج السابقة التي كانت تقتصر على بيئات محددة، يتمتع Genie 3 بقدرة فريدة على توليد عوالم افتراضية واقعية أو خيالية بالكامل، باستخدام أوامر نصية فقط.

والنموذج، رغم كونه لا يزال في مرحلة المعاينة البحثية ولم يطرح للاستخدام العام، يعد تطورًا ملحوظًا مقارنة بالإصدار السابق Genie 2، الذي كان محدودًا في قدرته على تصميم البيئات الاصطناعية.

ويعتمد Genie 3 على بنية فيديو متقدمة تُدعى Veo 3، تمنحه فهمًا أعمق للفيزياء وسلوك العناصر داخل العوالم الرقمية.

إنشاء عوالم دقيقة بنص واحد فقط

يمكّن Genie 3 المستخدم من توليد عوالم تفاعلية ثلاثية الأبعاد بدقة 720p وبمعدل 24 إطارًا في الثانية، من خلال إدخال نص بسيط فقط.

وتبرز إحدى الميزات الجديدة تحت اسم "أحداث موجهة بالنص"، والتي تسمح بالتفاعل الديناميكي مع البيئة أثناء توليدها، مما يعزز الإحساس بالحيوية والمرونة.

وواحدة من أبرز قدرات Genie 3 هي الحفاظ على التناسق الفيزيائي للعالم المولد مع مرور الوقت، بفضل آلية تعلمية تتيح للنموذج تذكر تفاصيل ما سبق إنشاؤه، وهذه الخاصية لم تبرمج صراحة، بل ظهرت تلقائيًا نتيجة التعلم الذاتي المستمر للنموذج، مما يعد إنجازًا تقنيًا بحد ذاته.

حجر أساس لتدريب العوامل الذكية المجسدة

ويرى الباحثون في ديب مايند من جوجل، أن Genie 3 قد يكون المحرك الأساسي لتدريب ما يعرف بـ "العوامل المجسدة" (Embodied Agents)، وهي كيانات رقمية ذكية قادرة على التعلم من التجربة، والتفاعل مع البيئات المعقدة بطريقة أقرب إلى الكائنات الحية.

ويقول جاك باركر-هولدر، أحد كبار الباحثين، إن Genie 3 لا يعتمد على محركات فيزيائية جامدة، بل يتعلم فهم العالم من خلال تحليل ما يولده بنفسه، وبهذا يمتلك وعيًا تدريجيًا بالقوانين الفيزيائية مثل الجاذبية وتفادي الاصطدامات، ويقوم بتوليد العوالم "إطارًا تلو الآخر" عبر أسلوب تسلسلي يعتمد على السياق السابق.

تجارب واقعية وتطبيقات مستقبلية

خلال اختبارات ميدانية، جرى ربط Genie 3 بوكيل ذكي متعدد العوالم يعرف باسم SIMA، حيث يطلب من النظام تنفيذ مهام مثل "المشي نحو الرافعة الحمراء"، وتمكن النموذج من أداء هذه الأوامر بدقة عالية، مستفيدًا من العالم الديناميكي الذي أنشأه ذاتيًا.

وترى ديب مايند أن استخدامات Genie 3 تتعدى الألعاب والتجارب التعليمية، إذ يمكن توظيفه في تصميم النماذج الأولية للأفكار الإبداعية، والتدريب الذاتي للعوامل الذكية، وحتى المحاكاة المتقدمة في مجالات البحث العلمي.

قيود تقنية وتحديات مستقبلية

رغم الإنجازات الملحوظة، لا يخلو Genie 3 من بعض التحديات التقنية التي ما زالت قيد التطوير:

• زمن التفاعل لا يزال محدودًا بعدة دقائق فقط، في حين تتطلب تطبيقات الذكاء المجسد جلسات مطولة تمتد لساعات.

• المحاكاة الفيزيائية ليست مثالية بعد، حيث لوحظ أن بعض الحركات – مثل انزلاق متزلج على الثلج – لم تكن واقعية تمامًا.

• سلوك العوامل الذكية داخل العوالم قد لا يكون دائمًا ناتجًا عن قرار ذاتي، مما يقلل من مستوى الاستقلالية المطلوبة.

هل تكون Genie 3 لحظة "Move 37" القادمة؟

استحضر باركر-هولدر اللحظة التاريخية في عام 2016، حين صدمت خوارزمية AlphaGo العالم بلعبتها رقم 37 ضد بطل العالم في الشطرنج الآسيوي Go، والتي اعتُبرت دليلاً على تفكير غير بشري وعبقري في آنٍ واحد، وقال "ربما لم نصل بعد إلى لحظة مشابهة مع العوامل المجسدة، لكن Genie 3 يمثل بالتأكيد خطوة جادة نحو هذا الإنجاز المنتظر".