Mühendislik ve Teknoloji

Düşünceleri Konuşmaya Çeviren Akıl Okuma Teknolojisi 101

Columbia Üniversitesi’nden nöromühendisler, ilk kez düşüncelerimizi anlaşılabilir ölçülerde konuşma diline çeviren bir sistem yarattılar. Beyin sinyalleri görüntülenen kişinin düşüncelerini sese dönüştürmek artık mümkün. Bu çığır açan gelişme sonucu konuşma sentezleyicilerin ve yapay zekanın güçlerinin birleşmesi; dolayısıyla bilgisayarlarla doğrudan beynimiz vasıtasıyla iletişime geçmenin yolları açılabilir.

Konuşma yetilerini kaybetmiş, amyotropik lateral skleroz tanılı veya felçli bir şekilde yaşayan kişiler için bu teknoloji, dış dünyayla olan bağlantılarını yeniden kazanmalarında oldukça yarar sağlayabilecek bir kilometre taşı olma potansiyelinde. “Sesimiz, arkadaşlarımızla, ailemizle ve etraftaki dünyayla bağ kurabilmemizi sağlar ve bir yaralanma ya da hastalık kaynaklı ses kaybı, kişi için son derece yıkıcı etkileri olabilen bir durumdur. Bu çalışma sayesinde, insanlara seslerini geri kazandırma potansiyelimiz var. Doğru teknolojiyle, insanların düşüncelerinin çıktısı alınarak dinleyici tarafından algılanabilir seslere dönüşebileceğini gösterdik.” diyor çalışmanın birinci yazarı Dr.Nima Mesgarani.

Akıl okuma teknolojisi nasıl çalışıyor?

İnsanların konuştuklarında veya konuşmayı hayal ettiklerinde bile, beyindeki hikâye anlatma merkezinin hareketlilik gösterdiği, onlarca yıllık araştırmalar sonucunda gösterilmiştir. Bu hareketlenmeleri gözlemleyip kaydeden ve çözümleyen uzmanlar, düşüncelerimizin beynimizin içinde saklı kalmasına gerek olmadığı, onun yerine sözlü konuşmaya dönüştürülebilecekleri bir geleceği öngörüyorlar.

Dr. Mesgarani ve çalışma arkadaşları ilk başlarda, ses frekanslarının görsel sunumları olan spektrogramları analiz eden basit bilgisayar modelleri üzerinde yoğunlaşmışlar. Bu girişimin anlaşılabilir konuşmaya benzer herhangi bir sonuç üretemeyip başarısız olmasıyla Dr.Mesgarani ve takımı, insanların konuşma kayıtlarıyla eğitilerek konuşma sentezleyebilen “vocoder” adında bir bilgisayar algoritmasına yöneldiler. 

“Bu aynı zamanda Amazon Echo ve Apple Siri uygulamaları tarafından sorularımıza cevap vermeleri için kullanılan teknolojinin aynısı.” diyor Dr.Mesgarani. Vocoder’a beyin aktivitelerini yorumlamayı öğretmek için Dr.Mesgarani, sinir cerrahı olan ve makalenin yardımcı yazarı Dr.Asesh Dinesh Mehta’yla takım oluşturmuşlar. Dr.Mehta, bir kısmı düzenli cerrahi işlem uygulanması gereken epilepsi hastalarını muayene etmekte. “Dr.Mehta ile çalışırken, halihazırda beyin ameliyatı geçiren epilepsi hastalarına farklı kişiler tarafından söylenen cümleleri dinleterek onların beyin aktivitelerini ölçtük ve bu sinirsel aktivite çizgileri sayesinde vocoder eğitildi.”

Bir sonraki aşamada, aynı hastalara konuşmacıların 0’dan 9’a kadar sayı sayışları dinletildi ve vocoder üzerinde yeniden kullanılabilecek şekilde beyin dalgaları kaydedildi. Bu sinyallere göre vocoder tarafından üretilen sesler analiz edilerek, biyolojik beynimizdeki nöron yapılarını taklit eden bir yapay zeka türü olan nöral ağlar tarafından gürültüler temizlendi.

Elde edilen sonuç ise sayıları sayarken kulağa robotik gelen bir sesti. Kaydın doğruluğunu teyit etmek amacıyla, Dr.Mesgarani ve takımı, kaydı dinleyip duyduklarını rapor etmeleri için kişiler görevlendirdiler.

“İnsanların bu sesleri %75 oranında anlayıp tekrar edebildikleri sonucuna vardık ki bu sonuç, önceki denemelerimizin oldukça üzerinde.” diyor araştırmacılar. Anlaşılabilirlikteki artış, önceki spektrogram bazlı kayıtlarla yeni kayıtların karşılaştırılmaları sonucunda özellikle belirgin bir haldeydi. “Hassas vocoder ve güçlü nöral ağlar bize, şaşırtıcı bir doğrulukla neredeyse hastaların dinlediği orijinal sesleri verdi.”

Dr.Mesgarani ve takımının sonraki planı ise daha karmaşık kelimeleri ve cümleleri test etmek olacak ve konuşan veya konuşmayı yalnızca hayalinde canlandıran bir kişinin yaydığı beyin dalgalarının üzerinde aynı testi uygulayacaklar. Nihayetinde, sistemlerinin bazı epilepsi hastaları tarafından kullanılanlara benzeyen ve kullanıcının düşüncelerini doğrudan kelimelere dönüştürebilen bir implant parçası olabilmesini umuyorlar.

“Senaryomuza göre, eğer kullanıcı “Bir bardak su istiyorum” diye düşünürse, sistemimiz bu düşünce tarafından yayılan beyin dalgasını alıp sentezleyerek sözel bir konuşmaya dönüştürecek. Bu teknoloji, oyunu değiştirebilecek türden bir şey olabilir. Sonuç itibariyle, yaralanma ya da hastalık sonucu konuşma yetisini yitirmiş bir insana, etrafındaki dünyayla yeniden bağlantı kurabilme şansını verebilir.”

KAYNAK: Engineers translate brain signals directly into speech; https://www.sciencedaily.com/

İLERİ OKUMA: Hassan Akbari, Bahar Khalighinejad, Jose L. Herrero, Ashesh D. Mehta, Nima Mesgarani. Towards reconstructing intelligible speech from the human auditory cortex. Scientific Reports, 2019; 9 (1) DOI: 10.1038/s41598-018-37359-z

Matematiksel

a. caner sönmez

yaşamı anlamlandırma yürüyüşünde, "hiç" olmaya giden yoldayım. bir gün tüm beyinlerin birbirine bağlanması, dolayısıyla birbirimizi doğru anlama kapasitelerimizin sonsuzluğa kavuşması hayalim. ve çocukların hepsinin birlikte gülmesi, doyması, doğru yaşaması.. “Bilimsel bilgiyi küçük bir grubun tekeline bırakmak bir toplumun düşün gücünü zayıflatır, onu tinsel yoksulluğa sürükler.” Albert Einstein “Gelmiş geçmiş tüm dikkat gerektiren uğraşlar içerisinde, sevmek uğraşı üzerinde gösterilen dikkat, en yaşamsal önemde olanıdır.” Bertrand Russell "Meselemi hiç'e bıraktım." Max Stirner
Başa dön tuşu