أعلنت شركة جوجل عن إطلاق الجيل الجديد من نموذجها اللغوي الكبير "Gemini 3"، الذي يأتي بعد شهور من الترقّب والتسريبات التقنية. ويُعدّ هذا النموذج أحد أبرز تحديثات الشركة في مجال الذكاء الاصطناعي التوليدي، مع وعود بتعزيز قدرات الاستدلال، والتعامل مع السياقات الطويلة، وتحسين الأداء في البرمجة وتوليد الواجهات التفاعلية.
تحسينات أساسية في نموذج Gemini 3
يقدّم "Gemini 3 Pro" مجموعة من التحديثات التي تشمل:
رفع مستوى قدرات الفهم والتحليل.
تحسين الدقة وتقليل الهلوسة.
تعزيز الاستجابة المباشرة والموجزة.
تطوير الأداء في تفسير الصور ومقاطع الفيديو.
وتشير جوجل إلى أن النموذج قادر على التعامل بشكل أكثر اتساقاً مع الطلبات المعقدة، سواء في التعليمات النصية أو المهام متعددة الوسائط.
سياق نافذة السياق الممتدة حتى مليون رمز
برزت إحدى أهم ميزات النموذج الجديد من خلال دعم نافذة سياق تصل إلى مليون رمز. وهو حجم يمكّن النموذج من التعامل مع:
وثائق تمتد لمئات الصفحات.
ملفات قانونية وتقنية طويلة.
سجلات اجتماعات أو قواعد بيانات برمجية كاملة.
محتوى بصري ونصي متعدد الطبقات.
ويمثّل هذا التطوّر خطوة مهمة مقارنة بنماذج أخرى ذات نوافذ أصغر، مثل GPT-4 Turbo أو الإصدارات السابقة من Gemini.
تعزيز قدرات النماذج متعددة الوسائط
يشمل تحديث Gemini 3 تحسينات في التعامل مع المحتوى النصي والمرئي والصوتي، مع توسيع القدرة على:
تحليل الصور والرسوم البيانية.
تفسير مقاطع الفيديو.
الدمج العميق بين النصوص والوسائط داخل ذات المهمة.
وتشير المعلومات إلى أن الأداء قد جرى معايرته ليتناسب مع بيانات تدريب تمتد حتى أغسطس 2024، بما يمنح النموذج قدرة أفضل على التعامل مع أحدث التوجهات التقنية والعلمية.
القدرات البرمجية وتوليد الواجهات التفاعلية
بحسب جوجل، يستطيع النموذج:
إنشاء أكواد قادرة على إنتاج واجهات ثلاثية الأبعاد.
تنفيذ تعليمات مركّبة عبر منصة Canvas داخل تطبيق Gemini.
بناء صفحات تفاعلية أو نماذج محاكاة اعتماداً على مصادر متعددة.
وقد طُرحت كذلك ميزة "التجربة الصفرية" (Zero-shot)، التي تتيح للنموذج إكمال مهام لم يدرّب عليها بشكل مباشر.
خدمة التحقق من المحتوى باستخدام SynthID
أدرجت جوجل ضمن "Gemini 3" ميزة "Is this AI-generated?"، المخصّصة للتحقق مما إذا كانت الصور منشأة أو معدّلة عبر الذكاء الاصطناعي.تعتمد الآلية على تقنية SynthID التي تضيف ترميزاً مخفياً داخل المحتوى المُنتج. وتعمل الشركة على توسيع نطاق التحقق ليشمل الصوت والفيديو ومعايير الصناعة مثل C2PA.
Gemini Agent: تنفيذ المهام عبر Gmail والخدمات المرتبطة
تختبر جوجل ميزة Gemini Agent للمشتركين في الفئة Ultra، بهدف تنفيذ المهام تلقائياً، مثل:
فرز البريد الإلكتروني.
إنشاء تذكيرات.
إدارة الحجوزات.
وتظهر التكاملات بوضوح مع Gmail وGoogle Tasks، حيث يستطيع النموذج تنظيم الرسائل والعثور على الرسائل المهمة أو اقتراح إجراءات مباشرة للمتابعة.
استخدامات متنوعة للعرض البصري التفاعلي
يقدم النموذج قدرة على إنشاء تخطيطات مرئية تفاعلية تشبه الصفحات الإلكترونية، يمكن استخدامها في:
بناء خطط سفر.
إنشاء أدلة تعليمية.
تنظيم المشاريع الشخصية.
وتأتي هذه الميزة ضمن تجربة "التخطيط البصري" التي تختبرها جوجل حالياً.
تسعير الخدمة
وفق وثائق مطوري Gemini بتاريخ 19 نوفمبر 2025:
أقل من 200 ألف رمز مدخل:
مدخلات: 2 دولار لكل مليون رمز
مخرجات: 12 دولاراً لكل مليون رمز
أكثر من 200 ألف رمز مدخل:
مدخلات: 4 دولارات
مخرجات: 18 دولاراً
خاتمة
يمثل "Gemini 3 Pro" خطوة إضافية في سباق النماذج اللغوية الضخمة، مع تركيز على توسيع نافذة السياق، وتعزيز القدرات متعددة الوسائط، ودمج التحليل البصري والنصي داخل مهام واحدة. وتعمل جوجل من خلال منظومة Vertex AI على تقديم النموذج للمطورين والمؤسسات، تمهيداً لمرحلة جديدة من تطبيقات الذكاء الاصطناعي العملية والمعقدة.