تعتمد الباحثة في دولة الإمارات ليندا زو على تكنولوجيا النانو
لتطوير مواد جديدة لاستخدامها في تلقيح السحب›››
في لعبة الشطرنج، غالبًا ما يُقيّم الشخص خارج اللعبة جودة مسار اللعب بناء على مستوى الترفيه وعنصر المفاجأة الذي يقدمه اختيار اللاعبين لحركاتهم، حيث تعتبر تعتبر مباراة الشطرنج ذات الجودة العالية تحدّيًا للعقل تتضمن استراتيجية تخطيطية وقدرة عالية في التحكم بالأداء، مما يجعلها رياضة شعبية بامتياز.
يبدو أن ظهور الذكاء الاصطناعي، وتحديدًا محركات الشطرنج البرمجية، قد رسمت هذه اللوحة النابضة بالحياة بألوان باهتة.
وفي هذا الإطار، تقبل لاعبو الشطرنج على مضض حقيقة أنه يمكن لمحركات الشطرنج التغلب عليهم لا سيما بعد هزيمة بطل العالم في الشطرنج غاري كاسباروف أمام خصمه ديب بلو من شركة “آي بي إم” في أواخر التسعينيات، لكن تقبل اللاعبون الفكرة بعد إدراكهم حقيقة أن محركات الشطرنج عملية وفعالة في أسلوبها. ففي محركات الشطرنج التقليدية، يفكر المحرك بعشرات الملايين من الحركات البديلة في الثانية، لكن يبقى أسلوب لعبه وقدرته المحدودة على التوقع أمرًا محسوبًا ومملًا وخاليًا من التشويق، حيث أنه يخلو من وجود الديناميكية والإبداع والعنصر الإنساني. الأمر الذي دعا المطورين إلى إدخال بعض العشوائية لرفع مستوى التحدي وإضافة نوع من عدم القدرة على التنبؤ، لكن نتج عن ذلك سلسلة من الحركات القابلة للتنبؤ والتي تخللتها أيضًا بعض الأخطاء العرضية.
يساهم الذكاء الاصطناعي في إنشاء جميع أنماط الحركات الممكنة بشكل دقيق، حيث يوفر درجات لتقييم نتائج المباريات وتأخذ هذه النتيجة في الاعتبار توازن القوة النسبية بين اللاعبين بعد كل حركة. فعلى سبيل المثال، إذا أخذ اللاعب الأبيض بيدقًا، تكون النتيجة +1، ولكن إذا خسر اللاعب الأبيض فارسًا، تكون النتيجة -3. وتتضمن المحركات الأكثر تطورًا معلومات موضعية، مثل موقع الأحجار على اللوحة وعوامل أخرى كحركة الأحجار وسلامة الملك.
يؤثر إضافة عنصر العشوائية على عمليات اتخاذ القرار، مما يقلل حاجة محركات الشطرنج لاختيار الحركات التي حددتها الخوارزميات مسبقًا والاستعاضة عنها بحركات تتسم بأنها أقل قدرة على التنبؤ لزيادة عنصر التشويق في اللعبة وبالتالي تصبح أكثر تحديًا.
ولا تزال محركات الشطرنج هذه تتحرك بناءً على أنماط طويلة من الحركات التي لا يمكن تصورها، والتي تتخللها أحيانًا حركات غريبة. ويدرك اللاعبون البشر أنه من غير المرجح أن يؤدي التوزيع العشوائي إلى حصول اللاعب على سلسلة انتصارات متتالية.
ويتعلم الجيل التالي من برامج الشطرنج، المدعومة بالشبكات العصبية الاصطناعية، من نماذج طرق سير اللعب بدلًا من الصيغ المحددة سابقًا، حيث تُشفّر هذه الشبكات العصبية كل موضع على اللوحة ونوع الحجر ولون اللاعب بنظام التمثيل الثنائي.
تُعتبر المخرجات قيمًا ناتجة عن التقييم، حيث تؤدي إلى لعب سريع وغير متوقع يُجرى من خلاله الجزء الأكبر من الحسابات أثناء التدريب، وليس أثناء الألعاب المباشرة. ويستخدم المطورون الملايين من ألعاب الشطرنج عبر الإنترنت، والتي يلعبها البشر ضد بعضهم أو ضد الآلات لإعداد بيانات التدريب، ونظرًا لأن النتيجة معروفة في كل لعبة، فمن الممكن ضبط النماذج بدقة أكبر واختيار الحركة الأفضل لكل سيناريو، وعند تدريب الشبكة العصبية الاصطناعية، يمكن لمحرك الشطرنج استخدامها لتقييم نتيجة كل حركة محتملة بسرعة وكفاءة، فتصبح بذلك محركات الشطرنج المعتمدة على الشبكة العصبية الاصطناعية روتينية ومملة بشكل أكبر.
وقد تمكن محرك ألفا زيرو الذي طورته شركة غوغل من تغيير الأمور لأنه يقوم على تطبيق نهج جديد قائم على الشبكة العصبية الاصطناعية والذي يمكن تدريبه على لعب الشطرنج وألعاب طاولة أخرى. وفي إطار هذه اللعبة، يجري محرك ألفا زيرو عمليات حوسبية على سياسة تقوم على رسم مسارات اللعبة وتوزيع الحركات المحتملة في لعبة الشطرنج. وتتضمن اللعبة 4,672 حركة محتملة لحركة اللاعب الأبيض الأولى فقط، وهو ما يُعد أمرًا غير منطقي بالنسبة للاعبين الأفراد، حيث يجب أن لا تتجاوز عدد الحركات الأولى القانونية للاعب الأبيض الـ20 حركة، وهنا تكمن الفكرة الرئيسة.
يتضمن محرك ألفا زيرو جميع أنواع الحركات غير القانونية، مثل اختيار المربعات الفارغة أو اختيار أحجار الخصم أو استخدام القلعة للقيام بحركات الفارس أو استخدام البيدق للقيام بتحركات قطرية طويلة، ويتضمن أيضًا الحركات التي تمر عبر الأحجار الأخرى التي تسد الطريق.
لا يتم أثناء التدريب تعلم أو فرض أي شيء فيما يتعلق بتجنب الحركات الخاطئة، حيث يكتفي المحرك بمعالجة مخرجات الشبكة العصبية الاصطناعية بينما ينتقي التحركات غير القانونية وغير الممكنة عن طريق ضبط احتماليتها الفعالة إلى الصفر، ثم يعيد الاحتمالات إلى حالتها الطبيعية عبر التحركات الصحيحة المتبقية. يمكن لأي شخص متخصص بالفلسفة أن يقول أن هذا المحرك غير أخلاقي لأنه لا يميز بين غير القانوني وغير الممكن نتيجة بساطة البنية التحتية للشبكة العصبية الاصطناعية التي تعبر فقط عن الحركات الصحيحة. وفي المعالجة الحديثة، يحتاج ألفا زيرو إلى بضع عشرات من أجزاء الثانية للقيام بحركة واحدة.
مكّنت هذه السرعة محرك ألفا زيرو من اللعب ضد نفسه في ملايين الألعاب، وأدى استكمال تدريبه بالتعلم المعزز الذي يميز الحركات التي اتبعت أنماطًا معينة لتحقيق الفوز في السابق. بالنسبة للأفراد، فحتى يتعلموا ما إذا كانت الحركة تتبع نمطًا ينتهي بالفوز، فيجب عليهم إكمال اللعبة، لذلك تم تعزيز ألفا زيرو من خلال اللعب “السريع والسطحي” باستخدام عمق بحثي سطحي جدًا، حيث يؤدي اللعب السطحي في مرحلة التدريب المعزز إلى زيادة عدد المباريات التي تنتهي بانتصارات وهزائم بدلًا من التعادلات غير المفيدة. ونتيجة لذلك، يأخذ محرك ألفا زيرو في الاعتبار مواضع أقل من محركات الشطرنج الخوارزمية التي تواجدت في السابق.
في محركات الشطرنج التقليدية، يفكر المحرك بعشرات الملايين من الحركات البديلة في الثانية لكن يبقى أسلوب لعبه أمرًا مملًا وخاليًا من التشويق.
ويتمتع محرك ألفا زيرو والأنظمة التي تلته مثل نظام (ديب تشيس) بأسلوب مميز، حيث أنها لا تركز فقط عن مزايا موضعية أو مادية، وإنما تبحث عن الأساليب غير المألوفة وغير التقليدية تمامًا كالموسيقى اللامقامية، والتي لا يقدر قيمتها إلا النخبة من الأفراد من ذوي المهارات العالية، أما بالنسبة للأشخاص العاديين الذين يرغبون بتطوير مهاراتهم في اللعبة فهي تعتبر غير مفيدة وغير مجدية. ومع كل ذلك، لا نزال نحن البشر نتعجب من أسلوب الحركات الموضعية للعبة الشطرنج والتي تقوم بها المحركات الذكية.
وفي الوقت الحاضر، يسلط سيناريو ما بعد ألفا زيرو الضوء على بعض المشاكل العامة التي يتعين علينا حلها حتى نتمكن مستقبلًا من العمل مع محركات الذكاء الاصطناعي التي فاقت القدرات البشرية ونحقق انتصار ديب بلو في التسعينيات. لذلك، يجب أن تكون عملية صنع القرار عند الذكاء الاصطناعي واضحة للبشر حتى يتمكنوا من فهمها وتقبلها وأن يُضاف ذلك في تدريب الذكاء الاصطناعي، إضافة لضرورة تفاعله مع الإنسان لما له من دور في تطور محرك الذكاء الاصطناعي، حيث يساهم اللعب مع المنافسين في تحسين قدراته بشكل يجعله أفضل مهارة من الإنسان.
تشير لعبة الشطرنج، التي تعبر مجازًا عن الحياة، إلى أن التحكم في تطور مستقبل محركات الذكاء الاصطناعي أمرًا صعبًا ويتطلب جهودًا كبيرة.
إرنستو دامياني، مدير أول لمعهد الروبوتات والأنظمة الذكية بجامعة خليفة.