كيف أصبحت الآلات تتحدث إلينا وكيف يمكنها قريبًا أن تشعر بمشاعرنا أيضًا

سوف تكون أجهزة الكمبيوتر قريبا قادرة على محاكاة عمل الدماغ البشري. وفي المستقبل القريب،هل يمكن أن يصبح الذكاءالاصطناعي أكثر قدرة على التفكير من البشر. ولكن هل يمكن للآلات أن تجرب مجموعة كاملة من المشاعر الإنسانية والعواطف، أم أن هناك قيود تقنية؟

 

بعد إعلان البشارة الكبرى في الستينيات بأن الآلات سوف تفكر كالبشر عما قريب، ظل الوضع كما هو من دون تطورات لعدة عقود؛ إلى أن بدأ ركب البحوث في الانطلاق في السنوات العشر السابقة أو نحوها فقط. وثمة الآن عدة منتجات رائجة في السوق تعمل بأداء مقبول من حيث التعرُّف على الكلام المنطوق على الأقل. ويحقق ذلك أحلام الطفولة بالنسبة إلى يورن شولر -الأستاذ ورئيس قسم النظم المعقدة والذكية بجامعة باساو بألمانيا، والذي نشأ على مشاهدة مسلسل “نايت رايدر” Knight Rider الذي يدور حول سيارة تتحدث كالبشر. وكان شولر أحد العلماء الشباب بالمنتدى الاقتصادي العالمي، وكان من المقرر أن يلقي كلمة في اجتماع المنتدى السنوي للأبطال الجدد في تيانجين بالصين المقام في الفترة من 26 إلى 28 من شهر يونيو الماضي. وقد تحدَّث مؤخرًا عن قرب الوصول لإمكانية توليف الآلات مع خصائص اللغة والسلوك والمشاعر عند البشر.

[فيما يلي نص المقابلة بعد تحريرها]

كيف بدأ اهتمامك بذكاء الآلة وتمييز الكلام؟

في طفولتي كنت أشاهد مسلسل “نايت رايدر” Knight Rider الذي ظهر في الثمانينيات، وكنت متعلقًا جدًّا بفكرة أنه ينبغي على الآلات أن تتحدث مع البشر بشكل يمكِّنها من فهم مشاعرهم.

 

كيف تعمل برمجيات تمييز الكلام المستخدمة في “سيري” Siri و”كورتانا” Cortana و”إيكو”Echo وغيرها من المنتجات؟

ثمة جانبان لطريقة عملها. يشمل الأول تمييز الحديث وعملية تركيب الجمل، وهو في الأصل يتجذر أكثر في عمليات معالجة الإشارات. أما الجانب الثاني فيتعلق بالمعالجة الطبيعية للغة، التي تعتمد أكثر على المعلومات النصية وتفسيرها. وفقًا لطبيعة الصوت، تستهدف الإشارات المنطوقة الكلمات أو معانيها. على سبيل المثال، تجمع كورتانا وأمازون إيكو بين الاثنين. وهما في الأساس منظومتا حوار منطوق، يمكنهما التحكم في الإشارة الصوتية المصاحبة للنص؛ إذ تحاولان فهم الفكرة من الكلمات ثم توليد سلسلة من الكلمات لترد بشيء له معنى.

ما حدود هذه التقنيات؟

مع أن حالة المنظومات من قبيل “كورتانا” و”سيري” و”أمازون إيكو” الراهنة جيدة فعلًا، إلا أنها برأيي لا تزال تفتقر إلى الكثير حتى تتمكن من الذهاب إلى ما هو أبعد من الكلمات المنطوقة. أحد مجالات خبرتي الرئيسية هو الجانب غير اللغوي للكلام – وهو أي شيء متعلق بالصوت أو الكلمات يعطينا معلومات عن حالة المتحدث وسماته، مثل عواطفه وشخصيته وعمره وجنسه، وحتى طوله. حين نتحدث، نحن لا نستمع فقط إلى نوايا بعضنا، بل ربما تسمع في نفس الوقت سنّي ولهجتي.

 

هل أنت متفائل حيال إمكانية تحقيق مزيد من الإنجازات المهمة؟

في مجال تعلُّم الآلة والذكاء الاصطناعي، دائمًا ما نرى التقدم يسير وفق نمط معين. فمن حين لآخر تظهر في المجال دفعة جديدة نحو الأمام، ونجاح وإنجاز جديدان؛ ولذلك أهمية عالية. ثم في مرحلة ما قد تواجَه تلك التوقعات بخيبة أمل. وربما تظهر دفعة كبيرة جديدة للأمام كل 10 سنوات.أشعر الآن بحماس شديد إزاء كل ما يحدث.

فبعد مرور 17 سنة منذ أن بدأت فعلًا البحث في هذا الموضوع، من المثير حقًّا رؤية كيف شقت منظومات الحوار المنطوق طريقها إلى الاستعمال الفعلي. وسوف نرى قريبًا جدًّا منظومات تكتسب ذكاءً عاطفيًّا واجتماعيًّا. هل نحن مُتعبون؟ هل أُصبنا بنزلة؟ هل نتناول الطعام الآن؟ في الواقع تعطينا هذه الأشياء أفكار متنوعة حول إدراك الآلة وسلوكها وتصرفاتها من الناحية الاجتماعية. ويمكن لذلك أن يُحدِث تغييرًا كبيرًا في المجتمع.