ياسمينا صلاح

كشف رئيس المجموعة العالمية للذكاء الاصطناعي الدكتور جاسم حاجي أن الذكاء الاصطناعي الصوتي، هو أداة للمحادثة تستخدم الذكاء الاصطناعي لتلقي التوجيهات وتفسير الأوامر الصوتية، وباستخدام هذه التقنية يمكن للأجهزة التفاعل والرد على الأسئلة البشرية صوتياً، ومع القدرة على فهم لغة الإنسان والتواصل معهم، أتاح روبوت الدردشة الصوتي المزود بالذكاء الاصطناعي فرصة كبيرة للشركات لخدمة العملاء، ويساعد على تسريع العمليات وزيادة الإنتاجية وتوسيع نطاق العمليات.

وأكد أن ما يقرب من 55% من مستخدمي المساعد الافتراضي يفضلون تطبيقات التعرف على الكلام لأنها توفر تشغيل الأجهزة بدون استخدام اليدين، ومع التوجه الحالي، يمكن أن تبلغ قيمة سوق مكبرات الصوت التي تعمل بالأوامر الصوتية 30 مليار دولار بحلول عام 2024.



وقال إن محللي الأوامر الصوتية بالذكاء الاصطناعي، وهم Amazon Echo و Siri و Google Assistant و Google Home و Amazon Alexa وغيرهم، هم عدد قليل من التطورات المذهلة التي لديها استبدال الحاجة إلى أجهزة تعمل باللمس، حيث يتوقع الخبراء أن يصل التسوق باستخدام تقنيات التحليل الصوتي إلى 40 مليار دولار في عام 2022.

وأضاف أن العمل الأساسي لهذه التقنية يعتمد الذكاء الاصطناعي لفهم اللغة البشرية وتفسيرها لتقديم النتائج المناسبة، تعمل برمجة الذكاء الاصطناعي على إتقان خوارزمياتها لتقديم أفضل إجابة منطقية باستمرار. يساعد مزيج من الذكاء الاصطناعي والأتمتة في تطوير أنظمة الكلام، كما هو الحال عندما يتواصل شخصان، يتم تشفير الرسالة وفك تشفيرها؛ يعمل الذكاء الاصطناعي الصوتي بشكل مشابه.

وبين أن الخطوات المتبعة في التعرف على الكلام في الذكاء الاصطناعي، وأولاً: تحليل الكلام وترجمته إلى نص وهي الخطوة الأولى في عملية فهم أوامر المتحدث، حيث تحتاج الموجات الصوتية التي يولدها المتحدث إلى تفسيرها وتحليلها لتقسيمها إلى أجزاء من النص.

وتستخدم الشركات تقنية التعرف على الكلام لهذه الخطوة. يتم تقسيم كلمات المستخدم إلى مجموعات بواسطة الذكاء الاصطناعي. في هذه العملية، ويتم تحويل الكلمات إلى أجزاء يسهل على النظام فهمها.

تابع وثانياً: تصفية الأصوات المحيطة، فهناك فرص أنه بالإضافة إلى الكلمات التي يتحدث بها المستخدم، ويتم التقاط بعض الأصوات المحيطة بواسطة الذكاء الاصطناعي. كما أن الاتصال بمركز اتصال أثناء السير على الطريق يمكن أن يزيد من فرص تسجيل الاضطرابات المحيطة مثل الأبواق أو الإعلانات التي تحدث في الرسالة، ثالثاً: التحويل إلى المعالجة العصبية، يعتمد الذكاء الاصطناعي الصوتي على الشبكات العصبية التي تقوم بتكرار الخلايا العصبية في دماغ الإنسان، ويتم تقسيم مجموعة البيانات التي تصل إلى النظام بشكل أكبر للعثور على أفضل تطابق، و رابعاً: التقنيات النحوية والدلالية، أصبح الذكاء الاصطناعي الصوتي قادراً على استخدام التقنيات النحوية والدلالية لتحليل النص، حيث يمكنه فهم الأوامر الصوتية بدقة، وخامساً: تقييم الاستجابة، يصل الذكاء الاصطناعي إلى مجموعة محددة من الاستنتاجات من خلال فحص سؤال المستخدم بعناية، تقوم الخوارزمية أيضاً بتحليل الحلول الأكثر احتمالاً وتصفية الردود للعثور على التطابق المثالي للاستعلام، وسادساً: التواصل مع المستخدم بالصوت، وفي هذه الخطوة الأخيرة يتم إرسال الاستجابة المحددة إلى المستخدم، وهنا يتلقى المستخدم الرد على الاستعلام بينما يقوم الذكاء الاصطناعي في نفس الوقت بتحويل البيانات بتنسيق صوتي، ويحفظ الذكاء الاصطناعي أيضاً الاستجابة للرجوع إليها في المستقبل.