قام علماء روس بتطوير نموذج جديد للذكاء الاصطناعي قادر على التعرف على العواطف من الكلام بدقة عالية.

ووفقًا لتقرير صحفي صادر عن شركة "سبير بنك”، فإن هذا التطوير يتفوق بشكل كبير على النماذج الحالية في التعامل مع المحتويات المعقدة.

وأشار التقرير إلى أن الكود الأساسي للنموذج متاح للجميع، مما يتيح للعلماء الآخرين استخدامه في أبحاثهم لإجراء تجارب إضافية واختبار النموذج مع لغات ومجموعات بيانات أخرى، مما يعزز قدرته على أداء مهام متعددة وتطبيقه في الظروف الواقعية. على سبيل المثال، يمكن تدريب النموذج على مجموعات بيانات عاطفية باللغة الروسية، ثم استخدامه في المساعدين الصوتيين ومراكز الاتصال.

تم تطوير الخوارزمية الجديدة، التي أطلق عليها اسم CA-SER، من قبل الباحثين في مختبر الذكاء الاصطناعي في شركة "سبيربنك” وجامعة موسكو النووية.

يعتمد النظام الجديد على نموذج التعلم الذاتي (SSL) ويجمع بين عدة منهجيات تُستخدم حاليًا في تحليل الكلام المنطوق والتعرف على العواطف.

يعمل النظام أولاً على اكتشاف الخصائص المهمة في الكلام، ثم يضيف إليها بيانات حول نبرة الصوت، بما في ذلك حجمها وشدتها، مع مراعاة الجزء من الطيف الصوتي الذي يستطيع الإنسان إدراكه بشكل أفضل. يتم دمج هذين النوعين من المعلومات بواسطة آلية خاصة، مما يسمح بدمج الخصائص العامة للكلام مع تفاصيله الدقيقة، مما يساعد في تحديد عواطف المتحدث بدقة أكبر.

اختبر العلماء الروس هذا النظام وتسعة أنظمة أخرى مماثلة باستخدام نماذج من قاعدة البيانات IEMOCAP التي تحتوي على مجموعة واسعة من التسجيلات الصوتية ومقاطع الفيديو والنصوص وتسجيلات الوسائط المتعددة المرتبطة بعدد كبير من العواطف البشرية.

أظهرت هذه الاختبارات أن النموذج الروسي يتفوق بشكل كبير على أنظمة الذكاء الاصطناعي الأخرى، وأصبح قابلاً للمقارنة مع شبكة HuBERT الأكثر تعقيدًا من شركة Facebook المحظورة في روسيا، والتابعة لشركة Meta. يأمل العلماء أن يساهم هذا التطوير في تحسين أداء المساعدين الصوتيين وغيرها من الأنظمة الرقمية التي تحتاج إلى التعرف بشكل صحيح على عواطف المستخدمين.