في خطوة تؤكد طموحاتها المتزايدة في قطاع الذكاء الاصطناعي، أعلنت شركة شاومي الصينية، عن إطلاق نموذج ذكاء اصطناعي صوتي مفتوح المصدر يحمل اسم MiDashengLM-7B ليكون ركيزة جديدة ضمن استراتيجيتها لتطوير تقنيات تتجاوز نطاق المعالجة النصية التقليدية، وتمتد إلى الصوت والتفاعل الطبيعي في الأجهزة الذكية.

ذكاء اصطناعي صوتي يخدم السيارات والمنازل

النموذج الجديد لا يعد فقط تطورًا تقنيًا، بل يمثل توجهًا واضحًا من شاومي نحو دمج الذكاء الاصطناعي في منتجاتها التي تشمل السيارات الذكية والأجهزة المنزلية.

وجرى تصميم MiDashengLM-7B اعتمادًا على نموذج صوتي داخلي طورته الشركة مسبقًا، ويعمل بالتكامل مع نموذج Qwen2.5-Omni-7B مفتوح المصدر الذي طورته شركة "علي بابا".

أداء استثنائي واختبارات معيارية

شاومي تطور نموذج صوتي مفتوح المصدر لتقنيات الذكاء الاصطناعي
play icon

وبحسب موقع "XiaomiTime" المتخصص في أخبار شركة شاومي تمكن MiDashengLM-7B من تحقيق نتائج قياسية عبر 22 معيارًا عامًا للأداء، مما يعكس تقدمه على كثير من الحلول المنافسة.

ومن أبرز مزايا النموذج الجديد هو السرعة العالية في الاستجابة، إذ لا يتجاوز زمن تأخير التوكن الأول نسبة 25% مقارنة بالحلول الحالية، ويقصد بزمن التوكن الأول الوقت الذي يستغرقه النموذج ليبدأ في الرد بعد استقبال الاستعلام، وهو مؤشر جوهري على كفاءة النماذج التفاعلية.

كفاءة في المعالجة وتقليل الحاجة للموارد

بعيدًا عن الأرقام يظهر النموذج الجديد قدرة كبيرة على التعامل مع عدد هائل من العمليات المتزامنة، حيث يمكنه تنفيذ مهام أكثر بـ20 مرة دون الحاجة إلى توسيع في موارد الذاكرة، وهو ما يعد نقطة قوة في استخدامه داخل أنظمة مضمنة مثل السيارات أو الأجهزة المنزلية.

تدريب قائم على بيانات مفتوحة

فيما يتعلق بتدريب النموذج، أوضحت شاومي أنها اعتمدت في تدريب MiDashengLM-7B على بيانات متاحة للعامة، مما يجعل منه نموذجًا شفافًا وقابلًا للتطوير المستقبلي في إطار مفتوح المصدر، وهذا النهج يعزز من فرص التوسع المجتمعي في تطويره وتكييفه مع سيناريوهات استخدام متعددة.