أعلنت شركة شاومي، إطلاق نموذج صوتي جديد مفتوح المصدر، يحمل اسم MiDashengLM-7B، والمخصص لتعزيز تجارب المستخدمين في مجالات السيارات الذكية والأجهزة المنزلية.
نقلة نوعية تتجاوز النصوص المكتوبة
يمثل النموذج الجديد تطورًا ملحوظًا في أدوات الذكاء الاصطناعي التي لم تعد تقتصر على المعالجة النصية، بل توسعت لتشمل التفاعل الصوتي الفوري والدقيق، ما يفتح آفاقًا أوسع لتطبيقات أكثر مرونة في الحياة اليومية.
اندماج تقني مع نموذج علي بابا
ويستند MiDashengLM-7B، إلى النموذج الصوتي الأساسي لشاومي، ويأتي مدمجًا مع نموذج Qwen2.5-Omni-7B المفتوح المصدر الذي طورته شركة علي بابا، في خطوة تعزز من قوة المعالجة وتنوع حالات الاستخدام.
أداء استثنائي وكفاءة عالية
وبحسب موقع XiaomiTime المتخصص، سجل النموذج أداءً مذهلًا على 22 معيارًا عامًا، حيث تفوق على منافسيه من حيث سرعة الاستجابة وكفاءة المعالجة.
ويبلغ زمن التوكن الأول – أي الوقت المستغرق للرد بأول كلمة – أقل بنسبة 25% من متوسط الزمن لدى حلول الذكاء الاصطناعي المشابهة.
قدرة غير مسبوقة في المعالجة المتزامنة
يمتلك MiDashengLM-7B قدرة على معالجة عدد عمليات متزامنة يزيد بمقدار 20 ضعفًا مقارنةً بالنماذج التقليدية، دون الحاجة إلى سعة إضافية من الذاكرة، ما يجعله مثاليًا للبيئات التي تتطلب أداءً فوريًا وفعالًا.
التدريب على بيانات مفتوحة المصدر
قامت شاومي بتدريب النموذج الصوتي الجديد على بيانات عامة متاحة المصدر، ما يعزز من شفافية الأداء ويدعم مجتمع المطورين في تطوير أدوات الذكاء الصوتي القابلة للتكامل بسهولة مع الأنظمة الذكية المختلفة.