في خطوة تعكس طموحها الجاد لتوسيع نفوذها في عالم الذكاء الاصطناعي أعلنت مجموعة "علي بابا" عن تعيين العالم الصيني المعروف لي شيانغانغ لقيادة قسم تقنيات الكلام والذكاء الاصطناعي الصوتي داخل الشركة.

ويُعتبر "لي" من أبرز الباحثين في هذا المجال حيث يحمل درجة الدكتوراه في علوم الحاسوب من جامعة بكين، ولديه سجل مهني طويل يشمل محطات مؤثرة لدى شركات مثل "بايدو" و"ديدي"، إلى جانب مشاركته في تأسيس شركة 01.AI المتخصصة في تطوير النماذج اللغوية.

نقلة استراتيجية لتعزيز الابتكار في الصوتيات

سيتولى "لي" قيادة فريق الذكاء الاصطناعي الصوتي داخل مختبر "تونغي" التابع لـ"علي بابا"، وهو القسم المسؤول عن تطوير حلول متقدمة في مجالات الكلام واللغة متعددة الوسائط، ويأتي انضمامه خلفًا للباحث يان تشيجي الذي شغل هذا المنصب سابقًا.

وكان المختبر قد أطلق في منتصف 2024 نموذجين مفتوحي المصدر هما SenseVoice وCosyVoice، حيث أثبت الأول تفوقًا كبيرًا في مهام التعرف على الكلام متعدد اللغات متجاوزًا أداء نموذج Whisper التابع لـ OpenAI بنسبة وصلت إلى 50% في اللغتين الصينية والكانتونية.

من التقنية إلى التجربة الإنسانية

تسعى "علي بابا" من خلال هذه الخطوة إلى تعزيز تقنياتها الخاصة بروبوتات المحادثة، والمساعدات الذكية، والصور الرمزية التفاعلية، في ظل منافسة شرسة من شركات كبرى مثل "بايدو" التي كشفت مؤخرًا عن شخصية رمزية شهيرة ضمن تقنياتها الجديدة.

ويملك "لي" خلفية تقنية قوية إذ سبق له تطوير نظام DeepSpeaker لتحديد المتحدثين أثناء عمله في "بايدو" كما قاد جهود "ديدي" في تفعيل التفاعل الصوتي داخل السيارات وخدمة العملاء الذكية.

وبعد مغادرته شركة 01.AI نتيجة تحول في استراتيجيتها دخلت الشركة في تعاون لاحق مع "علي بابا كلاود" لتأسيس مختبر مشترك يهدف إلى تصميم نماذج ذكاء اصطناعي مخصصة للاستخدام المؤسسي.

سوق واعد يتجه للنمو السريع

تشير تقديرات "ستاتيستا" إلى أن سوق تقنيات التعرف على الكلام في الصين سيصل إلى 1.66 مليار دولار هذا العام مع نمو سنوي يُقدّر بنحو 18%، قد يدفعه إلى تجاوز 4.4 مليار دولار بحلول 2031، وهو ما يبرر تسابق الشركات على الريادة في هذا المجال.