ركز الباحثون في شركة «أوبن إيه آي» خلال الأشهر الماضية على تطوير ذكاء اصطناعي بوسعه التعلم بطرائق أفضل.

هذه الخوارزمية تتيح للروبوتات التعلم من أخطائها

وتمكنت خوارزميات تعلم الآلة في الشركة من تعليم ذاتها بفضل تعزيز طرائق التعلم التي أتاحتها منصة «أوبن إيه آي بيسلاينز.»

وطورت الشركة مؤخرًا خوارزمية جديدة تتيح للذكاء الاصطناعي القدرة على التعلم من أخطائها، بذات الطريقة التي يتعلم فيها البشر.

وتتيح خوارزمية جديدة مفتوحة المصدر أطلق عليها اسم «هيندسايت إكسبيرينس ريبليه» أو اختصارًا «إتش إيه آر» برامج التطوير اللازمة.

وهي منصة أطلقها الباحثون في «شركة أوبن إيه آي» في وقت سابق هذا الأسبوع، تهدف لمساعدة الذكاء الاصطناعي على إعادة النظر بأخطائه وإدراكها وهو في طور إتمام المهام وإنجازها.

ووفقًا لمدونة الشركة، فإن الذكاء الاصطناعي يعيد النظر في الإخفاقات ويعدها خطوات لتحقيق النجاح.

وكتب الباحثون موضحين، «إن التصور الرئيس الذي ترسمه منصة إتش إي آر هو ما يفعله البشر بصورة بديهية؛ فعند إخفاقنا في تحقيق هدف محدد، نباشر بمحاولة تحقيق هدف آخر مختلف.

فلماذا لا نتظاهر بأن هذا الأخير هو ما أردنا تحقيقه منذ البداية، بدلًا من الهدف الأول الذي خططنا له منذ الأساس؟» أي ببساطة أكثر، تعد كل محاولة فاشلة للذكاء الاصطناعي خلال مسعاه لتحقيق هدف ما، بمثابة هدف افتراضي جديد غير مخطط له.

حاول أن تتذكر محاولاتك الأولى لتعلم ركوب الدراجة الهوائية، لا ريب في أنك أخفقت خلال محاولاتك الأولى في تحقيق التوازن بصورة صحيحة.

لكن هذه المحاولات الفاشلة هي التي ساعدتك في محاولاتك اللاحقة على عدم تكرار الأخطاء ومعرفة ما الذي يتحتم عليك تجنبه عند التوازن على الدراجة الهوائية.

أي أن كل محاولة فاشلة تقربك أكثر من تحقيق هدفك لأن هذه هي الكيفية التي يتعلم بها البشر.

مكافأة عند كل فشل

تهدف شركة «أوبن إيه آي» من إنشاء منصة «إتش إي آر» إلى تعلم أجهزة الذكاء الاصطناعي الطريقة ذاتها لتحل محل نظام المكافآت المعتاد المرتبط بتعزيز نماذج التعلم.

ولتحفيز الذكاء الاصطناعي على التعلم الذاتي لا بد أن يعمل ضمن نظام مكافآت؛ فلن يحصل الذكاء الاصطناعي على خوارزمية «كوكي» التي تعرف باسم ملف تعريف الارتباط، ما لم يسعى لتحقيق هدفه.

ويوجد نموذج آخر أيضًا يعطي ملفات «كوكيز» بالنظر إلى مدى اقتراب الذكاء الاصطناعي من تحقيق هدفه.

لكن لا يمكن أن نعد أيًا من هاتين الطريقتين مثالية في التعلم؛ فالطريقة الأولى تحد من التعليم وتتسبب في توقفه سواء بعد نجاح الذكاء الاصطناعي في تحقيق هدفه أو إخفاقه في ذلك بعد عدة محاولات.

أما الطريقة الثانية، فقد تكون معقدة تمامًا عند تطبيقها.

لكن عند التعامل مع كل محاولة فاشلة باعتبارها تحقيقًا لهدف، ومكافأة الذكاء الاصطناعي على الرغم من فشله في تحقيق مهمة محددة، فإن هذا من شأنه أن يساعد الذكاء الاصطناعي على التعلم بسرعة أكبر وبجودة أعلى.

ووفقًا لمدونة شركة «أوبن إيه آي،» «تتيح هذه الطريقة البديلة إمكانية حصول خوارزمية تعزيز التعلم على إشارة تقر بإنجازها لبعض المهام وتحقيقها لأهداف معينة؛ حتى وإن كانت أهدافًا مختلفة عن تلك التي من المفترض أن يحققها في الأساس.

إن أعدت هذه العملية مرارًا وتكرارًا ستتعلم كيفية تحقيق أهداف عشوائية أو اعتباطية قد تشمل الأهداف التي رسمتها لنفسك منذ البداية».

لا تعني هذه الطريقة أن منصة «إتش إي آر» سهلت على الذكاء الاصطناعي تعلم إنجاز مهام محددة، إذ قال «ماتياس بلابيرت» من شركة «أوين إيه آي،» «ما زال تعلم الروبوتات بالاعتماد على منصة إتش إي آر صعبًا، لكونه يتطلب عددًا محددًا من النماذج».

وبجميع الأحوال، يمكن أن تكون منصة «إتش إي آر» مفيدة جدًّا في تشجيع أجهزة الذكاء الاصطناعي على التعلم حتى من أخطائها، تمامًا كما يفعل جميع البشر، بفارق أن الأجهزة المزودة بتقنية الذكاء الاصطناعي لن تصاب بالإحباط عند اقترافها لأخطاء متعددة وإخفاقها في تحقيق أهدافها كما يفعل الضعفاء منا نحن معشر البشر.