العين الإخبارية

أعلنت شركة "ميتا" عن إطلاق نماذج جديدة لتقنية الكلام المستندة إلى الذكاء الاصطناعي.

النماذج الجديدة تم إطلاقها باسم "نماذج الكلام الضخمة المتعددة اللغات" (MMS)، والتي تستطيع التعرف على أكثر من 4000 لغة حول العالم. وتأتي هذه الخطوة في إطار حملة الشركة للحفاظ على اللغات من الانقراض، وتوفير خدمات تعرف الكلام وتوليدها بلغات مختلفة.

الذكاء الاصطناعي والتحديات الأخلاقية

وتعتمد تقنية MMS على الذكاء الاصطناعي لتحويل النص إلى كلام والعكس بأكثر من 1100 لغة، بزيادة عشرة أضعاف على ما كان متاحًا في السابق، وتستقدم خدمات متعددة للمستخدمين، مثل خدمات المراسلة وتقنيات الواقع الافتراضي والواقع المعزز، بحيث ستفهم كل الأصوات، وتخدم المستخدم بلغته المفضلة.

وتشير ميتا إلى أن تدريب نماذج تعرّف الكلام وتحويل النص إلى كلام يتطلب آلاف الساعات من التسجيلات الصوتية مع النصوص المفرّغة المصاحبة لها، وهذا أمر ضروري للغاية، حتى تفهم الخوارزميات النصوصَ وتصنفها بشكل صحيح.

ولجأت الشركة إلى استخدام طرق غير تقليدية من أجل جمع التسجيلات الصوتية للغات الأقل انتشارًا، حيث جمعت التسجيلات الصوتية للنصوص الدينية المترجمة إلى مختلف اللغات، وأرفقت تلك التسجيلات مع الترجمات المعتمدة، مما سمح للشركة بالحصول على 32 ساعة من البيانات للغات الأقل انتشارًا، وزيادة إجمالي اللغات في النماذج إلى أكثر من 4000 لغة.

وعلى الرغم من أن ميتا تواجه صعوبات في جمع تسجيلات صوتية للغات غير المستخدمة على نطاق واسع، فإنها تسعى لدعم المزيد من اللغات في نماذجها اللغوية المعتمدة على الذكاء الاصطناعي، بالإضافة إلى جعلها قادرة على التعامل مع اللهجات المختلفة لكل لغة، وهو تحد يواجهها حتى الآن.

يعتبر إطلاق شركة ميتا لنماذج MMS المفتوحة المصدر خطوة مهمة في إثراء مجال الذكاء الاصطناعي وتعريبه، بالإضافة إلى حماية اللغات من الانقراض وتوفير خدمات تعرف الكلام وتوليدها بلغات مختلفة.

ومن المتوقع أن تسهم هذه التقنية في تحسين تجربة المستخدم وتوفير خدمات متعددة بلغات مختلفة للمستخدمين حول العالم، وتعزز التواصل الدولي والتفاعل بين الثقافات واللغات المختلفة.