Teknoloji o kadar hızlı gelişiyor ki yapay zeka, ChatGPT gibi şeyler artık hepimizin dilinde; hatta cebinde. ChatGPT sayesinde birçok işimizi kolaylıkla halledebiliyoruz. Öyle ki yapay zeka zorlu sınavlarda yüksek notlar alıyor, makale yazıyor.
Buradan bakınca her şey gerçekten de heyecan verici görünüyor. Ancak yapay zekanın bu hızlı gelişimi birçoğumuzu da korkutuyor. Bu alandaki hem heyecan verici hem de biraz korkutucu gelişmelerden biri de ChatGPT’nin Turing testini geçmesi kuşkusuz. Turing testinin geçilmesi ne anlama geliyor? Yapay zekayı nasıl denetleyeceğiz? Gelin bu yazımızda bu sorulara cevap aramaya çalışalım.
Turing Testi Nedir?
Söz konusu test ismini İngiliz matematikçi, bilgisayar bilimcisi ve kriptolog Alan Turing’den alır. Kısaca Turing testi, bir makinenin insan zekasına sahip olup olmadığını ölçmek için tasarlanmış bir testtir. Testte insan bir yargıç, bir makine ve bir insan arasında yazılı bir sohbet gerçekleştirilir. Yargıç, yazışanlardan hangisinin insan hangisinin makine olduğunu bulmaya çalışır. Eğer yargıç makineyi insan sanırsa, makine Turing testini geçmiş olur.
Yazımızın başında da belirttiğimiz gibi ChatGPT Turing testini geçmeyi başardı. Başarısını ise sahip olduğu şu 3 beceriye borçlu: Diyalog yönetimi, doğal dil işleme ve sosyal beceriler. ChatGPT’nin testte verdiği cevaplar, yargıcın onun insan olduğunu sanmasına sebep oldu. Bu sayede de testi geçebildi. Ancak ChatGPT, Turing testini geçen ilk chatbot değil. Google’ın LaMDA (Language Model for Dialogue Applications) modeli, geçen yaz Turing testini geçmeyi başaran ilk yapay zeka olmuştu.
Turing Testi Artık Geçersiz mi?
Yukarıda da gördüğünüz gibi Turing testi oldukça basit bir testtir. Aslında Turing testi makinelerde çalıştırılacak gerçek bir test olarak tasarlanmamıştı. Bundan ziyade bir düşünce deneyi gibiydi. Bu nedenledir ki testte pek fazla ayrıntı yer almaz.
Buna rağmen bir makinenin/yapay zekanın düşünme yeteneğine sahip olup olmadığı konusunda dil becerisinden yararlanma fikri devam etti. Ancak Büyük Dil Modelleri’nin (LLM) geliştirilmesiyle Turing testinde yargıcın kandırılması kolaylaşmıştır.
Bilim insanları GPT-4 ve diğer LLM’lerin muhtemelen Turing testini geçmeyi başarabileceğini düşünüyorlar. Bu durum elbette Turing testinin artık geçersiz bir test olduğu anlamına gelmiyor. Çünkü yapay zekayı Turing testi yoluyla hala denetleyebiliriz. Bunu yapmanın yolu da söz konusu dil modellerini konfor alanından uzaklaştırmaktan geçiyor.
Yani yapay zekaya onu ifşa edecek soruları sormamız gerekiyor. Onun bu sorulara verdiği cevaplar bağlamında yapay zekayı değerlendirebiliriz.
Yapay Zekayı Turing Testi Dışında Yöntemlerle de Sınıyoruz
Bilim insanları yapay zekayı Turing testi dışındaki yöntemlerle de değerlendirmeye başladı. Bir yapay zeka sistemini dil yeteneği, sağduyulu akıl yürütme ve matematiksel kapasite gibi yönlerden değerlendiriyoruz artık. Aynı zamanda giderek artan bir şekilde insanlar için tasarlanmış akademik ve profesyonel sınavları da kullanıyoruz.
ChatGPT-4 bu yılın mart ayında piyasaya çıktığında geliştiricisi olan OpenAI şirketi GPT-4’ü test etti. Testin amacı GPT-4’ün okuduğunu anlama, matematik ve kodlama gibi becerilerini test etmekti. Ve ChatGPT-4 bunların birçoğundan istenilen sonucu verdi.
ABD’deki birçok eyalette geçerli olan avukatlık sınavında ChatGPT-4 şaşırtıcı bir başarı elde etti. GPT-4, sınava girenler arasında ilk %10’luk dilimde yer alacak bir puan elde etmişti. ChatGPT-4 ayrıca ABD’li lise öğrencileri için olan sınavları, ABD’li doktorların klinik becerilerini ölçen sınavları ve lisansüstü eğitim için bir seçme sınavını da çözdü.
Ancak bu sonuçlar yapay zekanın sınava giren birçok insandan daha başarılı veya daha zeki olduğu anlamına gelmez. Çünkü yapay zeka eğitilirken çok sayıda metin görmüştür. Yani yapay zeka sınavı çözerken aslında bünyesinde yer alan doğru cevabı arar. Örneğin sorulardan birisi bağlamı değiştirilmeden farklı kelimelerle ifade edildiğinde ChatGPT soruyu çözememiştir. İnsanlar ise soruyu yine de çözebilir.
Bu yüzden yapay zekanın düşünme ve akıl yürütme ile soruları çözdüğünü söylemek pek doğru olmaz. Ancak kontaminasyon sorunu adı verilen bu durum için bilim insanları tam anlamıyla fikir birliğine varamamıştır. Bunun için de çeşitli mantık bulmacaları geliştirerek yapay zekayı değerlendirmeye çalışıyoruz.
Yapay Zeka Akıl Yürütme Yeteneğine Sahip mi?
Bazı deneyler LLM’lerin soyut kavramlar hakkında ilkel bir akıl yürütme yeteneğine sahip olduğuna işaret ediyor. Harvard Üniversitesi’nde gerçekleştirilen bir deney buna örnek olarak verilebilir. Bu deneyde araştırmacılar Othello masa oyunun dijital bir versiyonunu kullandılar. Deneyin amacı LLM’lerin bizim gibi dünyanın iç temsillerini oluşturup oluşturamadığını belirlemekti.
Othello oyunu sonucunda araştırmacılar, yapay zekanın insanlar kadar akıl yürütme becerisine sahip olmadığını gördü. Ancak bu, akıl yürütme yetisine hiç sahip olmadıkları anlamına gelmiyor. Sadece bize göre oldukça sınırlı bir akıl yürütme becerisine sahip.
Bilim insanları halen yapay zekayı daha iyi değerlendirebilmek için testler geliştirmeye çalışıyor. Ve bu noktada unutmamamız gereken bir şey var. Birçoğumuz yapay zekayı anlamaya çalışırken ister istemez antropomorfik düşünüyoruz. Yani insan biçimci düşünüyoruz. Zeka belirtisi olan her şeyi antropomorfik bir şekilde ele alıyoruz. Bu nedenle de yapay zekanın “ev yapımı bir insan zekası” gibi bir şey olduğunu düşünüyoruz. Halbuki gerçek şu an için çok daha farklıdır.
Kaynaklar ve İleri Okumalar
- Celeste Biever ; ChatGPT broke the Turing test — the race is on for new ways to assess AI ; Bağlantı: ChatGPT broke the Turing test — the race is on for new ways to assess AI (nature.com) ; doi: https://doi.org/10.1038/d41586-023-02361-7
- ChatGPT Passes Turing Test: A Turning Point for Language Models ; Bağlantı: ChatGPT Passes Turing Test: A Turning Point for Language Models (mlyearning.org) ; Yayınlanma tarihi: 9 Mayıs 2023
Size Bir Mesajımız Var!
Matematiksel, 2015 yılından beri yayında olan ve Türkiye’de matematiğe karşı duyulan önyargıyı azaltmak ve ilgiyi arttırmak amacıyla kurulmuş bir platformdur. Sitemizde, öncelikli olarak matematik ile ilgili yazılar yer almaktadır. Ancak bilimin bütünsel yapısı itibari ile diğer bilim dalları ile ilgili konular da ilerleyen yıllarda sitemize dahil edilmiştir. Bu sitenin tek kazancı sizlere göstermek zorunda kaldığımız reklamlardır. Yüksek okunurluk düzeyine sahip bir web sitesi barındırmak ne yazık ki günümüzde oldukça masraflıdır. Bu konuda bizi anlayacağınızı umuyoruz. Ayrıca yazımızı paylaşarak veya Patreon üzerinden ufak bir bağış yaparak da büyümemize destek olabilirsiniz. Matematik ile kalalım, bilim ile kalalım.
Matematiksel