Biyoloji ve Genetik

DeepMind AlphaFold Biyolojinin 50 Yıllık Çözülemeyen Protein Katlanması Sorununu Çözdü

AlphaFold proteinlerin şekillerini bir atom genişliğindeki ölçeğe kadar tahmin edebiliyor. Bu devrimci yöntem bilim insanlarının yeni ilaçlar üretmesine ve hastalıkların nedenlerini daha iyi analiz etmelerine yardımcı olacak.

Artık günümüzde yapay zekanın ulaştığı seviye gözlerimizi giderek daha da fazla kamaştırıyor. DeepMind bu konuda önemli bir yerde. Kendisi birçok çeşitli oyunu da süper insan özellikleriyle oynayabilen müthiş bir yapay zekâ. Go, StarCraft ve Atari oyunlarının bütün çeşitlerini başarıyla öğrenmiş ve bitirmiş durumda.

Fakat Demis Hassabis, DeepMind’ın kurucularından ve toplumca bilinen yüzü olarak bu başarıların yalnızca çok daha büyük bir hedefe giden kilometre taşları olduğunun bilinci ve stresiyle hareket ediyor: Yapay Zekâ (AI) aslında tüm dünyayı anlamamıza yardımcı olacak.

DeepMind yapay zekâsıyla Hassabis’in kendisine biçtiği rolü yerine getirebilecek kapasiteye ulaştığını gösteren bir başarıyla daha çıkageldi. Uzun soluklu bir yarışma olan Protein Yapısı Tahminleri Üzerine Kritik Değerlendirme (CASP) organizatörlerinin ilan ettiği üzere, DeepMind’ın son versiyonu ve derin öğrenme sistemi olan AlphaFold, biyoloji biliminin önündeki büyük bir engeli aşıp başarılı oldu.

Bir atom genişliğine kadar olan protein yapılarını doğru şekilde tahmin edebiliyor. “Bu, ciddi bir sorunu çözmekte bir yapay zekânın ilk kez kullanımıdır.” diyor CASP ekibinin kurucusu, Maryland Üniversitesi’nden John Moult.

Protein Nedir?

Bir protein kendi kendine birçok karmaşık yolla katlanan amino asitlerden oluşan bir zincirdir. Bu yapı ne işlevde olacağını belirler ve proteinlerin neler yaptığını çalışıp çalışmadığı koşullarda deneyerek öğrenmek, yaşamın basit mekanizmalarını anlamamızı sağlar. COVID-19 aşısının geliştirilmesi çalışmaları virüsün mızrak (spike) proteini üzerinde yoğunlaşmıştır örneğin.

Koronavirüsün insan hücrelerine yapışması bu proteinin yapısına ve bağlanacağı hücrelerdeki protein yapılarına bağlıdır. Mızrak proteini bütün canlılar arasındaki milyarlarca çeşidi içinde yalnızca bir tanesi ve sadece insan hücresi içinde bunun on binlerce farklı tipi vardır.

Bu yılın CASP yarışmasında AlphaFold bir düzine proteinin yapısını sadece 1.6 anstrom –yani 0.16 nanometre veya atom genişliği- ölçeğinde bir hata payıyla doğru tahmin etti. Bu sonuç diğer bütün kompütasyonal metodların hassasiyetini aştı ve ilk kez bir laboratuvarda kullanılan tekniklerle elde edilen doğrulukta bir bilgi sağladı.

Kriyojenik elektron mikroskobu, nükleer manyetik rezonans ve x-ışını kristallografisi gibi yöntemlerle boy ölçüşen AlphaFold; bu tekniklerin çok pahalı, yavaş oluşu ile her bir protein için yıllar süren çalışmalara yüksek meblağlar harcanmasını da ekleyince yapay zekasıyla bir proteinin yapısını birkaç günde bulabilmesindeki müthiş devrim daha bir ortaya çıkıyor.

Yeni ilaçlar yapma ve hastalıkların nedenlerini anlamak

Bu devrim araştırmacılara yeni ilaçlar yapma ve hastalıkların nedenlerini anlamak konusunda çok yardımcı olacak. Uzun dönemde bu gelişme sayesinde sentetik proteinler ve enzimler üretilip örneğin atıkların yok edilmesi ve biyoyakıt üretimi gibi konularda daha verimli çalışmalar sağlanabilecek. Araştırmacılar, sentetik proteinler yoluyla tarım ürünleri ve bitkilerin daha besleyici olmaları için yeni keşifler gerçekleştiriyor.

“Bu çok temelden gelen büyük bir başarı. Hiç bu kadar çabuk yapılabileceğini tahmin etmediğim bir gelişme ve çok şaşırtıcı.” diyor Columbia Üniversitesi’nden sistem biyoloğu Mohammed AlQuaraishi.

“Gerçekten büyük bir başarı. Go ile yaptıkları gibi.” diyor Washington Üniversitesi’nde Protein Tasarlama Enstitüsü’nün ve proetin analiz araçları ailesi Rosetta’nın arkasındaki ekibin başındaki isim olan David Baker.

Bir proteinin yapısını tanımlamak çok zordur. Çoğu protein için araştırmacılar ellerinde aminoasit dizilimini bulundururlar fakat katlandıkları yapıyı bilemezler. Ve bu yapıyı tahmin etmek için gerçekten de her bir dizilimi hesaba katınca çok büyük astronomik rakamlarda olasılıklar bulunur. Bilim insanları bu zorlukla ilgili olarak, Christian Anfinsen’in yapıyı belirleyen dizilimleri göstermesiyle kazandığı Nobel ödülünü almasından, yani 1970’lerden bu yana uğraşmakta idiler.

1994’te CASP organizasyonunun oluşturulmasıyla hızlanan alanda, laboratuvar çalışmalarının büyük zorlukları ve yavaşlığı aşılarak ilerleme kaydedilmesi için on yıllarca süren çabalar verildi. Dünyanın çeşitli yerlerinden düzinelerce araştırma grubu yazılım yoluyla doğru protein katlanmasını bulmak için birbirleriyle yarıştılar. Bu CASP aracılığıyla geliştirilen yazılımlar tıbbi araştımacılar tarafından zaten kullanılmaktaydı fakat süreç çok yavaştı.

DeepMind AlphaFold’un ilk versiyonuyla gelerek 2018 yılındaki CASP yarışmasına katıldığında işler değişmeye başladı. Bir laboratuvarda elde edildiği doğrulukta sonuçlar veremese de diğer kompütasyonal metodların tozunu attı.

Bu seneki yarışmada ise başvuruların yarıdan fazlası derin-öğrenmenin çeşitli türlerini kullanarak yarışmaya katıldılar. Sonuçlarda genel olarak elde edilen doğruluk payları yüksekti. Baker’ın trRosetta isimli yeni sistemi, 2018’deki DeepMind’ın fikirlerinden bir kısmını kullanıyordu. Fakat yine de büyük farkla ikinci oldu.

Yarışmada 0-100 arasında global ölçeklendirme testi kullanılarak yapılan değerlendirme sonrasında DeepMind AlphaFold kendsine verilen proteinlerin üçte ikisinde 90 ve üzerinde puan alırken; ekibin lideri John Jumper’a göre en zor proteinin tahmininde ise en yakın rakibinden 25 puan daha önde yer aldı.

90 üzerindeki bir sonucun bize anlattığı; tahmin edilen yapı ile esas yapı arasındaki hata payı laboratuvar koşullarındaki hata payı oranına kadar azaltılabiliyor. Yazılım kaynaklı bir hataya neredeyse rastlanmıyor. Ayrıca tahmin edilen yapı, laboratuvarda tanımlanan yapının doğal varyasyonları sınırında kalan geçerli alternatif bir konfigürasyonunu sağlıyor.

Ekibin lideri Jumper, yarışmada bağımsız jürinin laboratuvarda üzerinde çalıştığı 4 adet proteinin tamamlanmamış yapısının da AlphaFold sayesinde doğru biçimde tahmin edilebildiğini söylüyor.

AlQuaraishi’nin düşüncesine bakılırsa da AlphaFold’un bu gelişmesiyle elde edilen noktaya normal koşullarda araştırmacılar ancak 10 yıl içerisinde gelebilirlerdi. Bu, ne kadar doğru olabileceğimizin fiziksel sınırlarına yakın bir durum, diyor.

Puzzle Parçaları

AlphaFold dünyanın dört bir yanındaki araştırmacıların çalışmaları üzerine adım adım kuruluyor. DeepMind ayrıca çok geniş bir skaladaki uzmanlıkları bir araya getiriyor, biyologlar, fizikçiler ve bilgisayar bilimcileri olmak üzere. Nasıl çalıştığına dair ayrıntılar bu hafta CASP konfeansında paylaşılacak ve gelecek yıl Proteins dergisinin özel sayısında makale olarak basılacak. Fakat biz kesin olarak biliyoruz ki bu yapay zekâ bir tür dikkat ağı kullanıyor ve sorunun üzerinde çok çeşitli açılardan çalışabilmesine olanak veren derin-öğrenme tekniğini geliştiriyor. Jumper bu yaklaşımı bir yapbozun oluşumu ile karşılaştırıyor: önce bölgesel parçaları birbirine bağlayıp sonra bütüne olan uyumunu sağlamak.

DeepMind halka açık protein veri bankasından alınan 170.000 civarındaki protein ile AlphaFold’un eğitimini yaptı. Bankadaki çoklu dizileri karşılaştırıldı ve katlanmış yapılarda bir araya gelerek yakınlaşan aminoasit çiftleri arandı. Daha sonra bu veri, henüz nasıl olduğu bilinmeyen üç boyutlu yapının içindeki aminoasit çiftlerinin birbirlerine olan uzaklıklarını tahmin etmekte kullanıldı. Ayrıca bu tahminlerin ne derece doğru olduğunu da değerlendirebilen yapay zekânın eğitimi, bilgi işlem gücü 100 ilâ 200 GPU arası olan bilgisayarlarla yalnızca “birkaç hafta” sürdü.

İngiltere Cambridge’de bulunan Avrupa Biyoinformatik Enstitüsü’nden Dame Janet Thornton proteinler üzerinde 50 yıldır çalışmakta. Geçen haftaki basın toplantısındaki sözleri hislerini açıklıyor: “Gerçekten de bu sorunun ortaya çıkışından beri çalışmaktayım ve yaşam sürem içerisinde çözülemeyeceğini düşünmeye başlamıştım.”

Birçok ilaç 3 boyutlu moleküler yapı simulasyonlarıyla incelenerek moleküllerin hedef proteinlere anahtar-kilit gibi yerleştirilmesi biçiminde tasarlanır. Bu işlem tabii ki eğer o proteinin yapısı biliniyorsa başarıya ulaşır. Tahmini 20.000 insan proteininin yalnızca çeyreği kadarı üzerinde yapılan çalışmalar için bu yöntemin kullanıldığını, geriye henüz dokunulmamış 15.000 adet ilaç hedefi kaldığını söylüyor Thornton ve ekliyor: “AlphaFold bu araştırmalarda yepyeni bir alan açacak.”

DeepMind çalışmaları arasında özellikle bilinmeyen proteinlerle ilişkili olan bütün parazit kaynaklı tropikal hastalıkların üzerine eğilmeyi planlıyor, bunlardan bazıları leishmania, uyku hastalığı ve sıtma.

AlphaFold’un tek dezavantajı diğer rakip tekniklere göre daha yavaş olması. AlQuraishi’nin sisteminde tekrarlayan geometrik ağ (RGN) isimli algoritma kullanılıyor ve protein yapılarını milyonlarca kat daha hızlı buluyor, birkaç günden birkaç saniyeye kadar indiriyor. Tahminlerin doğruluk payı azalıyor fakat AlQuraishi bazı araştırmacılar için uygulama süresinin, doğru tahminden daha önemli olduğunu söyleyerek şunları ekliyor: “Enzimler veya bakteriler üzerinde çalışanlar için daha az doğruluk payı içeren bir sonuç bile çok iyi haber olacaktır ve hatta elimizde daha iyi olan şey ise: farmasötik uygulamalara hızlıca geçilebilecek olması.”

Araştırmacılar şu anda AlphaFold’un nasıl çalıştığını tam olarak anlamak ve anlatmak üzerine çalışıyorlar. Baker’a göre: “Dünyaya bu sistemin nasıl çalıştığını bir kere tam olarak tarif edebildiklerinde binlerce çiçek açacak. İnsanlar bu bilgiyi çok çeşitli şeyler için kullanabilecekler, henüz hayalini bile kuramadığımız şeyler..”

a. caner sönmez

Kaynak: MIT Technology Review

Matematiksel

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.

İlgili Makaleler

Başa dön tuşu