الذكاء الاصطناعي يقتحم ساحة تفوق البشر في ألعاب الورق

الذكاء الاصطناعي يقتحم ساحة تفوق البشر في ألعاب الورق كما قال الفنان العظيم كيني روجرز إحدى المرات، على اللاعب البارع أن يعرف متى يحتفظ بأوراقه ومتى يطرحها.

وفى كازينو ريفز بيتسبيرج، ومع مطلع العام 2017 ،تمكن برنامج حاسوبي يسمى ليبراتوس من إثبات قدرة الحواسيب على فعل ذلك بشكل يفوق أي لاعب بشري.

خاض ليبراتوس الآلاف من مباريات البوكر بمختلف أنواعه ضد عدة لاعبين محترفين، وبعد مرور نصف المنافسة البالغة عشرين يوماً، تمكن من الفوز بحوالي 800 الف دولار من خصومه البشر، متجهاً نحو الفوز النهائي بختام المنافسة.

يمثل فوز ليبراتوس إنجازاً هاماً مجال الذكاء الاصطناعي؛ حيث يتطلب البوكر نوعاً من المنطق والذكاء الذي ثبتت صعوبة محاكاته بالنسبة للآلات.

إنه مختلف جذرياً عن الداما والشطرنج وجو، لأن أوراق الخصم تبقى مخبأة خلال اللعب. وفى ألعاب ”المعلومات الناقصة“، من الصعب للغاية وضع إستراتيجية مماثلة تأخذ بعين الاعتبار جميع الحركات الممكنة من الخصم، خصوصاً عندما يكون بوسع الخصم أن يراهن بأي مبلغ دون حدود.

يقول آندرو إنج، العالم الرئيسي فى بايدو: ”ُيعتبر البوكر من أصعب الألعاب بالنسبة للذكاء الاصطناعي. فلا توجد حركة مثالية واحدة، بل يجب عليه أن يقوم ببعض الحركات العشوائية بحيث يحتار الخصم فيما إذا كان يحاول خداعه“ .

تم تصميم ليبراتوس من ِقبل توماس ساندهولم، وهو بروفسور قسم علوم الحاسوب جامعة كارنيجي ميلون، إضافة لنوم براون، وهو أحد طلاب الدراسات العليا.

ويرى ساندهولم -وهو خبير نظرية الألعاب هاجر من فنلندا لتقديم رسالة الدكتوراه- أن من المذهل أن البشر تمكنوا من التفوق على الحواسيب اللعب لهذه الفترة الطويلة، وقد قال قبل انتهاء المنافسة: ”إن مهارة هؤلاء المحترفين تثير الدهشة.

ومن بين جميع الألعاب التي أتقنها الذكاء الاصطناعي، فإن البوكر هي الوحيدة التي لم يتمكن فيها الذكاء الاصطناعي من تجاوز مستوى اللعب البشري“

يعتمد باحثو الذكاء الاصطناعي على نظرية الألعاب، أو الرياضيات التي تعنى باتخاذ القرارات الإستراتيجية، وذلك للعدد الهائل من الاحتمالات، فإن لتحديد أفضل إستراتيجية – أو ما يسمى بالتوازن- بوجود عدة مجاهيل، ونظراً هذا القرار يتضمن عادة شكلاً من أشكال التقريب.

يقول فنسنت كونيتزر، وهو بروفسور يعلم الذكاء الاصطناعي ونظرية الألعاب جامعة ديوك: ”إن صحة الحركة تعتمد على الأشياء التي لا يمكنك رؤيتها، وهو ما يؤدي أيضاً إلى وجوب أن تلعب بطريقة غير متوقعة.

إذا لم تحاول الخداع على الإطلاق، فأنت لاعب غير بارع، وإذا كنت تحاول الخداع على الدوام، فأنت لاعب غير بارع. تخبرك نظرية الألعاب بالكيفية التي تجعل لعبك عشوائياً بطريقة يمكن القول أنها مثالية .

قاد ساندهولم فى2016 عملية تطوير برنامج سابق للعب البوكر باسم كلاوديكو، وقد تعرض لهزيمة نكراء أمام عدة محترفين بشر.

ويشرح أن ليبراتوس يعتمد على عدة تطورات إضافية لتحقيق هذا المستوى المرتفع من اللعب، مثل أسلوب جديد لتقريب التوازن، إضافة إلى عدة طرق جديدة لتحليل النتائج الممكنة مع كشف المزيد من الأوراق في مراحل لاحقة من اللعب.

إن تحليل نتيجة اللعبة بهذه الطريقة أمر فائق التعقيد من الناحية الحاسوبية، ويتم إجراؤه خلال كل لعبة مركز بيتسبرج للحوسبة الخارقة، وهو منشأة تقوم بتشغيلها جامعة كارنيجي ميلون وجامعة بيتسبرج.

وقد أدت تطورات التعلم والذكاء الاصطناعي إلى ظهور عدة برامج تتفوق على البشر اللعب؛ ففي 2016 ،قام باحثو ديب مايند -وهي شركة تابعة لشركة ألفابيت- بتطوير برنامج قادر على التغلب على واحد من أفضل لاعبي جو العالم.

وقد كان هذا الإنجاز مذهلاً، لأن جو لعبة فائقة التعقيد، ولأن من الصعب قياس مدى التقدم ضمن اللعبة غير أن انتصار ليبراتوس لا يعني انسحاب البشر من طاولة اللعب، حيث إن النسخة متعددة اللاعبين مسألة مختلفة تماماً، ولا يستطيع ليبراتوس إتقانها بنفس الأساليب .

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى