سوف تكون أجهزة الكمبيوتر قريبا قادرة على محاكاة عمل الدماغ البشري. وفي المستقبل القريب،هل يمكن أن يصبح الذكاءالاصطناعي أكثر قدرة على التفكير من البشر. ولكن هل يمكن للآلات أن تجرب مجموعة كاملة من المشاعر الإنسانية والعواطف، أم أن هناك قيود تقنية؟
بعد إعلان البشارة الكبرى في الستينيات بأن الآلات سوف تفكر كالبشر عما قريب، ظل الوضع كما هو من دون تطورات لعدة عقود؛ إلى أن بدأ ركب البحوث في الانطلاق في السنوات العشر السابقة أو نحوها فقط. وثمة الآن عدة منتجات رائجة في السوق تعمل بأداء مقبول من حيث التعرُّف على الكلام المنطوق على الأقل. ويحقق ذلك أحلام الطفولة بالنسبة إلى يورن شولر -الأستاذ ورئيس قسم النظم المعقدة والذكية بجامعة باساو بألمانيا، والذي نشأ على مشاهدة مسلسل “نايت رايدر” Knight Rider الذي يدور حول سيارة تتحدث كالبشر. وكان شولر أحد العلماء الشباب بالمنتدى الاقتصادي العالمي، وكان من المقرر أن يلقي كلمة في اجتماع المنتدى السنوي للأبطال الجدد في تيانجين بالصين المقام في الفترة من 26 إلى 28 من شهر يونيو الماضي. وقد تحدَّث مؤخرًا عن قرب الوصول لإمكانية توليف الآلات مع خصائص اللغة والسلوك والمشاعر عند البشر.
[فيما يلي نص المقابلة بعد تحريرها]
كيف بدأ اهتمامك بذكاء الآلة وتمييز الكلام؟
في طفولتي كنت أشاهد مسلسل “نايت رايدر” Knight Rider الذي ظهر في الثمانينيات، وكنت متعلقًا جدًّا بفكرة أنه ينبغي على الآلات أن تتحدث مع البشر بشكل يمكِّنها من فهم مشاعرهم.
كيف تعمل برمجيات تمييز الكلام المستخدمة في “سيري” Siri و”كورتانا” Cortana و”إيكو”Echo وغيرها من المنتجات؟
ثمة جانبان لطريقة عملها. يشمل الأول تمييز الحديث وعملية تركيب الجمل، وهو في الأصل يتجذر أكثر في عمليات معالجة الإشارات. أما الجانب الثاني فيتعلق بالمعالجة الطبيعية للغة، التي تعتمد أكثر على المعلومات النصية وتفسيرها. وفقًا لطبيعة الصوت، تستهدف الإشارات المنطوقة الكلمات أو معانيها. على سبيل المثال، تجمع كورتانا وأمازون إيكو بين الاثنين. وهما في الأساس منظومتا حوار منطوق، يمكنهما التحكم في الإشارة الصوتية المصاحبة للنص؛ إذ تحاولان فهم الفكرة من الكلمات ثم توليد سلسلة من الكلمات لترد بشيء له معنى.
ما حدود هذه التقنيات؟
مع أن حالة المنظومات من قبيل “كورتانا” و”سيري” و”أمازون إيكو” الراهنة جيدة فعلًا، إلا أنها برأيي لا تزال تفتقر إلى الكثير حتى تتمكن من الذهاب إلى ما هو أبعد من الكلمات المنطوقة. أحد مجالات خبرتي الرئيسية هو الجانب غير اللغوي للكلام – وهو أي شيء متعلق بالصوت أو الكلمات يعطينا معلومات عن حالة المتحدث وسماته، مثل عواطفه وشخصيته وعمره وجنسه، وحتى طوله. حين نتحدث، نحن لا نستمع فقط إلى نوايا بعضنا، بل ربما تسمع في نفس الوقت سنّي ولهجتي.