تزايدت التكهنات في الأوساط التقنية الصينية مؤخرًا حول قرب إطلاق الجيل الجديد من نموذج اللغة الكبيرDeepSeek-R2 خلال الشهر الجاري.
وبعد أن ألمحت نماذج DeepSeek نفسها إلى فترة إطلاق محتملة ما بين 15 و30 أغسطس؛ سرعان ما خرج مصدر مقرّب من الشركة لينفي هذه الشائعات بشكل قاطع مؤكدًا عدم وجود أي خطط لإطلاق النموذج في أغسطس.
أسباب تأخر DeepSeek-R2
لم تكن هذه المرة الأولى التي يثار فيها الجدل حول خارطة طريق DeepSeek ، إذ سبق أن انتشرت شائعات في وقت سابق من هذا العام عن إطلاق النموذج في 17 مارس، لكنها أيضًا لم تتحقق.
وحتى الآن لم تكشف الشركة عن موعد رسمي أو أي تفاصيل تقنية رئيسية تخص R2 .
وتشير التوقعات إلى أن النموذج سيشكل نقلة نوعية في قدرات التفكير متعدد اللغات وتوليد الأكواد البرمجية، ليكون منافسًا لنماذج رائدة مثل GPT-4 وGPT-5.
لكن المعلومات تؤكد أن ليانغ وينفنغ الرئيس التنفيذي للشركة غير راضٍ عن أداء النموذج حتى الآن، رغم أشهر من التطوير المكثف.
التحديات التقنية والبنية التحتية
لا يرتبط التأخير فقط بتحسين الأداء، بل يشمل أيضًا عقبات على مستوى البنية التحتية، وتعمل الشركة بقدرات حوسبة محدودة خاصة بعد حظر تصدير شرائح Nvidia H20 إلى الصين، ما أثار مخاوف من أن يؤدي الإطلاق المبكر إلى ضغط كبير على أنظمتها إذا ارتفع الاستخدام بشكل مفاجئ.
لمواجهة هذه الأزمة، تتجه DeepSeek للاعتماد على شرائح Huawei Ascend 910B، التي توفر مراكز الحوسبة الخاصة بها أداءً يصل إلى 512 بيتافلوبس بدقة FP16 وبكفاءة تشغيل 82%، أي ما يعادل نحو 91% من أداء مراكز Nvidia A100.
وعلى الرغم من أن هذه الأرقام مشجعة لكن من غير المؤكد إذا كانت هذه البنية قادرة على دعم إطلاق ضخم للنموذج.
مستقبل النموذج في ظل المنافسة
رغم أن نموذج DeepSeek نفسه قد ألمح إلى إطلاق وشيك، يعكس موقف الشركة حذرًا شديدًا، والنموذج موجود ويجرى اختباره، لكنه لم يصل بعد إلى الجاهزية الكاملة للإطلاق التجاري.
وفي سوق الذكاء الاصطناعي شديد التنافسية؛ تحتاج الشركة إلى أكثر من مجرد نموذج قوي، فهي بحاجة إلى منتج مستقر، قابل للتوسع، ويستوفي متطلبات السوق.
حتى ذلك الحين تبقى الأنظار مسلطة على DeepSeek لمعرفة ما إذا كان R2 سيتمكن من تلبية التوقعات المتزايدة.