د. جاسم حاجي
يمكن لواجهة الدماغ والآلة الحديثة التي أنشأها علماء الأعصاب أن تولِّد خطابا اصطناعيا طبيعيا عن طريق استخدام نشاط الدماغ للتحكم في جهاز صوتي افتراضي وهو عبارة عن محاكاة كمبيوتر مفصلة تشريحيا بما في ذلك الشفاه والفك واللسان والحنجرة.
وأجريت الدراسة على المشاركين في الأبحاث باستخدام النطق السليم، ولكن التكنولوجيا يمكن أن تستعيد يومًا ما أصوات الأشخاص الذين فقدوا القدرة على الكلام بسبب الشلل وغيره من أشكال الضرر العصبي.
السكتة الدماغية، وإصابات الدماغ المؤلمة، والأمراض العصبية التنكسية مثل مرض باركنسون، والتصلب المتعدد، والتصلب الجانبي الضموري (ALS، أو مرض لو جيريج) غالبا ما تؤدي إلى فقدان لا رجعة فيه في القدرة على الكلام. ويتعلم بعض الأشخاص الذين يعانون من إعاقات شديدة في النطق أن يقوموا بتوضيح أفكارهم حرفًا تلو الآخر باستخدام أجهزة مساعدة تقوم بتتبع حركات عضلات الوجه أو العين الصغيرة جدًا.
ومع ذلك، فإن إنتاج نص أو خطاب مركب باستخدام هذه الأجهزة هو أمر شاق، وعرضة للخطأ، وبطيء للغاية، ويسمح عادة بـ 10 كلمات في الدقيقة كحد أقصى ، مقارنةً بالـ 100-150 كلمة في الدقيقة من الكلام الطبيعي.
يوضح النظام الجديد الذي يتم تطويره في المختبر - الموصوف في 24 أبريل 2019 ، في مجلة Nature - أنه من الممكن إنشاء نسخة مركبة من صوت الشخص والذي يمكن التحكم فيها من خلال نشاط مراكز النطق في الدماغ.
ويقول المؤلفون إنه في المستقبل، لن يتمكن هذا النهج من اعادة التواصل بطلاقة للأفراد الذين يعانون من إعاقة شديدة في النطق فحسب، ولكن يمكنه أيضًا أن يعيد إنتاج بعضاً من الصوت الموسيقي للصوت البشري الذي ينقل مشاعر المتحدث وشخصيته.
المسالك الصوتية الافتراضية تحسن تركيب الكلام الطبيعي
يعتمد البحث على دراسة حديثة وصف فيها العلماء لأول مرة كيف يقوم مركز الكلام في الدماغ البشري بتصميم حركات الشفتين والفك واللسان ومكونات المسالك الصوتية الأخرى لإنتاج الكلام بطلاقة.
من خلال ذلك العمل، أدرك العلماء بأن المحاولات السابقة لفك تشفير الكلام من نشاط الدماغ ربما حققت نجاحا محدودا لأن مناطق الدماغ هذه لا تمثل بشكل مباشر الخصائص الصوتية لأصوات الكلام، بل الإرشادات اللازمة لتنسيق حركات الفم والحلق أثناء الكلام.
العلاقة بين حركات المسالك الصوتية وأصوات الكلام التي يتم إنتاجها هي علاقة معقدة. لقد استنتج العلماء أنه إذا كانت مراكز الكلام هذه في الدماغ ترمز إلى الحركات بدلاً من الأصوات. يجب أن يحاولوا أن يفعلوا الشيء نفسه في فك رموز تلك الإشارات.
الذكاء الاصطناعي واللغويات وعلم الأعصاب
يقوم الباحثون حاليًا بتجربة مصفوفة الأقطاب عالية الكثافة وخوارزميات التعلم الآلي الأكثر تقدماً التي يأملون أن تحسن الخطاب المركب بشكل أكبر.
الاختبار الرئيس التالي للتكنولوجيا هو تحديد ما إذا كان الشخص الذي لا يستطيع التحدث يمكن أن يتعلم استخدام النظام دون أن يتمكن من تدريبه على صوته وجعله يعمم على أي شيء يرغب في قوله.
تشير النتائج الأولية لأحد المشاركين في فريق البحث إلى أن النظام القائم على التشريحية للباحثين يمكنه فك شفرة وتوليف الجمل الجديدة من نشاط الدماغ للمشاركين تقريبًا بمثل كفاءة الجمل التي تم تدريب الخوارزمية عليها.
حتى عندما قام الباحثون بتزويد الخوارزمية ببيانات نشاط الدماغ المسجلة بينما كان أحد المشاركين يتفوه الجمل من دون اخراج صوت، كان النظام لا يزال قادرًا على إنتاج نسخ تركيبية واضحة للجمل المحاكية في صوت المتحدث.
يمكن لواجهة الدماغ والآلة الحديثة التي أنشأها علماء الأعصاب أن تولِّد خطابا اصطناعيا طبيعيا عن طريق استخدام نشاط الدماغ للتحكم في جهاز صوتي افتراضي وهو عبارة عن محاكاة كمبيوتر مفصلة تشريحيا بما في ذلك الشفاه والفك واللسان والحنجرة.
وأجريت الدراسة على المشاركين في الأبحاث باستخدام النطق السليم، ولكن التكنولوجيا يمكن أن تستعيد يومًا ما أصوات الأشخاص الذين فقدوا القدرة على الكلام بسبب الشلل وغيره من أشكال الضرر العصبي.
السكتة الدماغية، وإصابات الدماغ المؤلمة، والأمراض العصبية التنكسية مثل مرض باركنسون، والتصلب المتعدد، والتصلب الجانبي الضموري (ALS، أو مرض لو جيريج) غالبا ما تؤدي إلى فقدان لا رجعة فيه في القدرة على الكلام. ويتعلم بعض الأشخاص الذين يعانون من إعاقات شديدة في النطق أن يقوموا بتوضيح أفكارهم حرفًا تلو الآخر باستخدام أجهزة مساعدة تقوم بتتبع حركات عضلات الوجه أو العين الصغيرة جدًا.
ومع ذلك، فإن إنتاج نص أو خطاب مركب باستخدام هذه الأجهزة هو أمر شاق، وعرضة للخطأ، وبطيء للغاية، ويسمح عادة بـ 10 كلمات في الدقيقة كحد أقصى ، مقارنةً بالـ 100-150 كلمة في الدقيقة من الكلام الطبيعي.
يوضح النظام الجديد الذي يتم تطويره في المختبر - الموصوف في 24 أبريل 2019 ، في مجلة Nature - أنه من الممكن إنشاء نسخة مركبة من صوت الشخص والذي يمكن التحكم فيها من خلال نشاط مراكز النطق في الدماغ.
ويقول المؤلفون إنه في المستقبل، لن يتمكن هذا النهج من اعادة التواصل بطلاقة للأفراد الذين يعانون من إعاقة شديدة في النطق فحسب، ولكن يمكنه أيضًا أن يعيد إنتاج بعضاً من الصوت الموسيقي للصوت البشري الذي ينقل مشاعر المتحدث وشخصيته.
المسالك الصوتية الافتراضية تحسن تركيب الكلام الطبيعي
يعتمد البحث على دراسة حديثة وصف فيها العلماء لأول مرة كيف يقوم مركز الكلام في الدماغ البشري بتصميم حركات الشفتين والفك واللسان ومكونات المسالك الصوتية الأخرى لإنتاج الكلام بطلاقة.
من خلال ذلك العمل، أدرك العلماء بأن المحاولات السابقة لفك تشفير الكلام من نشاط الدماغ ربما حققت نجاحا محدودا لأن مناطق الدماغ هذه لا تمثل بشكل مباشر الخصائص الصوتية لأصوات الكلام، بل الإرشادات اللازمة لتنسيق حركات الفم والحلق أثناء الكلام.
العلاقة بين حركات المسالك الصوتية وأصوات الكلام التي يتم إنتاجها هي علاقة معقدة. لقد استنتج العلماء أنه إذا كانت مراكز الكلام هذه في الدماغ ترمز إلى الحركات بدلاً من الأصوات. يجب أن يحاولوا أن يفعلوا الشيء نفسه في فك رموز تلك الإشارات.
الذكاء الاصطناعي واللغويات وعلم الأعصاب
يقوم الباحثون حاليًا بتجربة مصفوفة الأقطاب عالية الكثافة وخوارزميات التعلم الآلي الأكثر تقدماً التي يأملون أن تحسن الخطاب المركب بشكل أكبر.
الاختبار الرئيس التالي للتكنولوجيا هو تحديد ما إذا كان الشخص الذي لا يستطيع التحدث يمكن أن يتعلم استخدام النظام دون أن يتمكن من تدريبه على صوته وجعله يعمم على أي شيء يرغب في قوله.
تشير النتائج الأولية لأحد المشاركين في فريق البحث إلى أن النظام القائم على التشريحية للباحثين يمكنه فك شفرة وتوليف الجمل الجديدة من نشاط الدماغ للمشاركين تقريبًا بمثل كفاءة الجمل التي تم تدريب الخوارزمية عليها.
حتى عندما قام الباحثون بتزويد الخوارزمية ببيانات نشاط الدماغ المسجلة بينما كان أحد المشاركين يتفوه الجمل من دون اخراج صوت، كان النظام لا يزال قادرًا على إنتاج نسخ تركيبية واضحة للجمل المحاكية في صوت المتحدث.