Günlük Hayatımızda Matematik

Oyun Teorisi Ve Yapay Zeka Poker Oyununu Nasıl Şekillendirdi?

Artık poker oyuncuları, oyun teorisinin matematiksel temelleri sayesinde ve yapay zekâ desteğiyle her elde en doğru hamleyi bulabiliyorlar. Ancak ilginç bir şekilde, oyuncular bu kusursuz stratejiyi her zaman uygulamıyorlar.

Yüksek bahisli bir poker masasındasınız. Rakibiniz önündeki fişleri iterek oyunun en büyük hamlesini yapıyor. Sen de elindeki kartlara bakıyorsun: İki tane altılı. Oynadığınız oyun, Texas Hold’em adı verilen bir poker türü. Masada sadece ikiniz kaldınız ve henüz ortadaki ortak kartlar açılmadı. Ya rakibinin hamlesine karşılık verecek ve oyunda kalacaksın ya da kartlarını yere bırakıp elden çekileceksin.

Olasılık tablolarını çalışmışsın, ihtimalleri kafanda hesaplıyorsun. Bu bilgiler, objektif olarak bakıldığında, elden çekilmenin en doğru karar olduğunu söylüyor. Ancak turnuva boyunca gözlemlediğin bir şey var. Rakibin çoğu zaman elinde çok güçlü kartlar olmadığı hâlde aşırı cesur bahisler yapıyor. Şimdi büyük soru şu. Öğrendiğin teorik bilgilerle hareket edip pas mı geçeceksin? Yoksa rakibinin zaafını görüp kendi planını mı değiştireceksin?

İşte bu seçim, yani “matematiksel olarak en doğru stratejiye uymak mı yoksa rakibin zayıf yönlerinden yararlanmak mı,” pokerde en çok tartışılan konulardan biridir. Bu tartışmanın kökleri yaklaşık 80 yıl öncesine, oyun teorisinin ilk geliştiği yıllara uzanır.

Günümüzde ise yapay zekâ çalışmaları sayesinde bu eski matematik yeniden gün yüzüne çıktı. Şimdi oyunculara, matematiksel olarak en doğru hareketlerin ne olduğu öğretiliyor. Ancak yine de, gerçek masalarda oyuncular bazen bu kuralların dışına çıkmayı tercih edebiliyor.

Poker İle Oyun Teorisi Neden İlişkilidir?

Poker gibi bir oyunda, en doğru hamleleri yapmanın mümkün olması ilk anda şaşırtıcı gelecektir. Mesela blöfü ele alalım. Kartlar hakkında yalan söylemek, tamamen psikolojik bir hamle gibi görünür. Ancak insan davranışını sistemli denklemlerle açıklama konusunda matematikçilerin yeteneğini asla küçümsememek gerekir.

Gerçekten de matematikçi John von Neumann ve ekonomist Oskar Morgenstern, 1944’te yayımladıkları eserlerinde, pokeri merkeze alarak oyun teorisinin ilk önemli örneklerinden birini sundular.

Oyun teorisi, 1944 yılında “Oyun Teorisi ve Ekonomik Davranış”ın yayınlanmasıyla resmen dünyaya girdi. Bu, Avusturyalı bir ekonomist olan Oskar Morgenstern ile Neumann arasındaki işbirliğinin sonucuydu.

Yazarlar, pokerin sadeleştirilmiş bir modelini geliştirdi. Bu modelde her oyuncuya rastgele 0 ile 1 arasında bir değer atanıyordu. Değer ne kadar büyükse, oyuncunun eli o kadar güçlü oluyordu. Oyuncular sadece tek bir bahis turunda karşı karşıya geliyordu.

Von Neumann ve Morgenstern, bu basit oyunda bile belirli bir optimal strateji olduğunu kanıtladı. Üstelik, en doğru stratejinin içinde mutlaka blöf yapmanın da yer alması gerektiğini gösterdiler.

Nash, 1950’lerde henüz yeni doğmakta olan oyun teorisi alanına büyük katkı sağladı.

Elbette Texas Hold’em gibi gerçek poker oyunları bu örnekten çok daha karmaşıktır. Burada akla şu soru gelir. Çok oyunculu gerçek poker için de optimal bir strateji var mı? Bu sorunun cevabını ünlü matematikçi John Nash verdi.

Nash Dengesi Nedir?

Nash dengesi, bir oyunda hiçbir oyuncunun, diğerleri stratejilerini değiştirmediği sürece, kendi stratejisini değiştirerek daha iyi bir sonuç elde edemeyeceği durumu tanımlar.

Oyun teorisyenleri bu durumu optimal kabul eder. Çünkü iki kişi bir oyun oynarken, rastgele stratejiler seçeriz. Ardından biri diğerinin hamlelerini gözlemleyip kendi stratejisini değiştirmeye çalışır, diğeri de buna karşılık verir. Bu karşılıklı uyum arayışı devam ettikçe, sonunda her ikimizin de daha iyi bir sonuç elde edemeyeceği bir denge noktasına ulaşırız.

Nash dengesi, böyle kararlı bir durumu temsil eder. Üstelik oyuncular stratejilerini önceden açıkça ilan etseler bile, herkes için en iyi hamle yine bu dengeye sadık kalmak olur. John Nash, 1950 yılında yalnızca bir sayfalık makalesinde, satrançtan Magic: The Gathering gibi kart oyunlarına kadar her sonlu rekabetçi oyunun en az bir Nash dengesine sahip olduğunu matematiksel olarak kanıtladı.

Oyun teorisindeki “oyun” kelimesi, sadece eğlence amaçlı oyunları kapsamaz. Bu teori, ekonomik sistemlerden nükleer caydırıcılığa, evrimsel biyolojiye kadar çok geniş bir alanda geçerlidir. Araştırmacılar için “oyun”, mantıklı karar vericiler arasında, ödüllerin ve hamlelerin net biçimde tanımlandığı her türlü etkileşimi ifade eder.

İnsanlar karmaşık kararları nasıl alır? Bu sorunun cevabı oyun teorisi kapsamında ele alınır.

Bu yüzden Nash’in teoremi geniş kapsamlı sonuçlar doğurur. Poker özelinde ise, içgüdülere ve yüz ifadelerini okumaya dayandığı düşünülen bir oyunda bile, en uygun stratejilerin matematiksel olarak bulunabileceğini gösterir.

Yapay Zekâ ile Pokerde Bir Devrim

Texas Hold’em oyununun bir Nash dengesine sahip olduğunu bilmemiz, bu dengenin tam olarak nasıl göründüğünü bildiğimiz anlamına gelmiyor. Oyunlar karmaşıklaştıkça, optimal stratejileri bulmak da zorlaşıyor.

Örneğin, birkaç hamle dizisini ezberleyerek bir oturumda kusursuz şekilde üç taş (tic-tac-toe) oynamak mümkündür. Ancak dama gibi daha gelişmiş bir oyunda — ki dama kusursuz oynandığında her zaman berabere biter — insanlar optimal stratejiyi uygulayacak kadar çok varyasyonu ezberleyemez. İşin içine bilgisayarlar girince durum değişir.

Satrançta da benzer bir gelişim yaşandı. 1997’de dünya şampiyonu Garry Kasparov’un IBM’in Deep Blue bilgisayarına karşı kaybetmesinden bu yana, satranç motorları en iyi insan oyuncuları yenebiliyor. Ancak günümüzün en güçlü motorları bile hâlâ kusursuz, yani tamamen optimal oynamıyor.

Satrançtan farklı olarak poker, eksik bilgiye dayalıdır. Oyuncular sadece kendi kartlarını bilir, rakiplerinin kartlarını bilemez. Bu da pokerin bilgisayarlar tarafından modellenmesini çok daha zor hale getirir. Bu nedenle, pokere yönelik algoritmik devrim ancak son yıllarda yapay zekâdaki büyük ilerlemelerle mümkün oldu.

2015 yılında bilgisayar bilimcileri, yalnızca iki oyuncunun karşılaştığı ve bahis miktarlarının belli sınırlar içinde tutulduğu özel bir poker versiyonu için neredeyse kusursuz oynayan bir yapay zekâ geliştirdiklerini açıkladılar. Yani, bu yapay zekâ belirli kurallar altında insanlardan çok daha doğru kararlar alıyordu.

Sadece dört yıl sonra, çok daha karmaşık ve çok oyunculu Texas Hold’em için insan seviyesinin üstünde performans gösteren bir yapay zekâ ortaya çıktı. Bu, poker dünyasında bir dönüm noktasıydı.

Bu ilerlemeyi takiben, “çözücü” (solver) adı verilen özel yazılım programları hızla piyasaya çıktı. Çözücüler, oyunculara hemen her durumda en iyi hamlenin ne olduğunu hesaplayarak gösteriyor. Artık birkaç yüz doları olan her ciddi poker oyuncusu, cebinde adeta bir yapay zekâ danışmanıyla masaya oturabiliyor.

Oyun Teorisi Yardımı İle Pokerde Nasıl Kazanılır?

Günümüzde en üst seviyede rekabet etmek isteyen profesyonel oyuncular, PioSOLVER gibi yazılımlar kullanarak sistemli biçimde çalışıyor. Bu programlar, en doğru stratejilere çok yakın çözümler üretiyor. Oyuncular, sık karşılaşılan basit durumlar için yapay zekânın önerdiği hamleleri doğrudan ezberliyor. Daha nadir görülen ve karmaşık pozisyonlarda ise yapay zekânın genel yaklaşımından prensipler öğreniyorlar.

Tıpkı satranç motorlarında olduğu gibi, çok oyunculu poker çözücüleri de hâlâ tam anlamıyla kusursuz oynamıyor. Ancak insanlara karşı öyle büyük bir üstünlük sağlıyorlar ki, onlardan öğrenecek çok şey olduğu artık tartışmasız kabul ediliyor.

Bir strateji, oyuncuların hiçbirinin daha iyi bir sonuç elde etmek için hamlesini değiştirme ihtiyacı duymadığı zaman dengeye ulaşır. Ancak rakiplerinden biri bu dengeden saparsa, senin de stratejini değiştirip bu sapmaya karşılık vermen akıllıca olur. Nash dengesi, rakibinin seni sömüremeyeceği tek oyun biçimidir.

Bugün poker oyuncuları, yapay zekâ destekli çözücülerden öğrendikleri optimal tekniklerle sadece en iyi hamleleri yapmakla kalmıyor. Aynı zamanda rakiplerinin hatalarını fark edip bunları nasıl cezalandıracaklarını da öğreniyorlar. Burada önemli bir soru ortaya çıkıyor. Eğer rakibin hata yapıyorsa, neden Nash dengesine sadık kalıp fırsatları kaçırmak yerine, onun zayıflıklarını kullanmayalım?

Eski profesyonel poker oyuncusu Igor Kurganov bu durumu şöyle açıklıyor. “Rakibinin yaptığı bir hatayı fark ettiğin anda, onun oyun hakkındaki düşünme biçimini daha iyi anlamış olursun. Bu bilgiye göre kendi stratejini değiştirirsin. Fakat bu değişim seni de sömürülebilir hale getirir.”

Çoğu profesyonel oyuncu, üst seviyede başarılı olabilmek için optimal ve sömürücü oyun stratejilerini birlikte kullanmanın şart olduğu konusunda hemfikir. Optimal oyun daha savunmacıdır, riskten kaçınır. Sömürücü oyun ise daha saldırgandır, doğrudan rakibin açıklarını hedef alır.

Bazı öğretmenler, bir turnuvaya başlarken önce optimal oynamayı, rakiplerin zaafları gözlemlendikten sonra sömürücü hamlelere geçmeyi tavsiye eder. Stratejiler arasında esnek bir şekilde geçiş yapabilmek, amatörlerle ustalar arasındaki en büyük farklardan biridir.

Sonuç Olarak

Kimilerine göre, insanüstü poker yazılımlarının ortaya çıkışı oyunun gizeminden biraz çalmış gibi. Onlara göre, oyundaki büyü kayboldu. 2019’da profesyonel pokeri bırakıp bilim iletişimi ve hayırseverlik gibi alanlara yönelen Liv Boeree de bu görüşte. Boeree, “Bu gelişmeler sanki oyunun sihrini biraz bozdu, ‘Artık sır kalmadı’ gibi hissettirdi,” diyor.

Yine de Boeree, pokerin hâlâ büyük bir ilgi gördüğünü de kabul ediyor. “COVID sonrası poker yeniden patladı. Geçen yıl Dünya Poker Serisi’ne tarihteki en yüksek katılım oldu. Rekorlar kırıldı. Yani görünen o ki, bu değişim oyunu öldürmedi.” Aslında poker dünyası hâlâ yeni dengesini bulmaya çalışıyor.


Kaynaklar ve ileri okumalar

Professional Poker Players Know the Optimal Strategy but Don’t Always Use It. Yayınlanma tarihi: 16 Temmuz 2024. Kaynak site: Scientific American. Bağlantı: Professional Poker Players Know the Optimal Strategy but Don’t Always Use It

Matematiksel

Sibel Çağlar

Temel eğitimimi Kadıköy Anadolu Lisesinde tamamladım. Devamında Marmara Üniversitesi İngilizce Matematik Öğretmenliği bölümünü bitirdim. Çeşitli özel okullarda edindiğim öğretmenlik deneyiminin ardından matematiksel.org web sitesini kurdum. O günden bugüne içerik üretmeye devam ediyorum.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir