Yapay Zeka ve Protein Yapısı Tahmini
Yapay zeka, günümüzde insan vücudundaki neredeyse her proteinin yapısını tahmin etmek için etkili bir araç olarak kullanılmaya başlanmıştır. Bu çığır açıcı gelişme, bazı hastalıkların tedavisi için yeni ilaçların keşfedilmesi gibi pek çok uygulamayı büyük ölçüde kolaylaştırabilir. Proteinler, her canlıda hayati öneme sahip yapı taşları olarak kabul edilir. Sahip olduğumuz her hücre, birçok proteinden oluşmaktadır.
Proteinlerin şeklini anlamak, tıp alanında ilerlemek için son derece önemlidir. Ancak bugüne kadar bu yapıların yalnızca belirli bir kısmı üzerinde çalışmalar yapılabilmiştir. Araştırmacılar, şimdi AlphaFold adını verdikleri bir program sayesinde, insanda ve diğer organizmalarda bulunan toplamda 350 bin proteinin yapısını tahmin edebilme başarısını göstermektedir.
İnsan genetik yapısında, protein üretimi için gerekli bilgiler, insan hücrelerinin çekirdeklerinde bulunan DNA’larda yer almaktadır. İnsan genetiğinde bu proteinlerin yaklaşık 20 bininin tanımı mevcuttur. Biyoloji uzmanları, bunların tümüne “proteom” adını vermektedir. Bu proteomlar, hücre genetiğini oluşturan genler tarafından şifrelenen proteinlerin toplamını ifade eder.
DeepMind şirketinin kurucu ortaklarından ve yöneticisi olan Dr. Demis Hassabis, AlphaFold programından elde edilen sonuçlarla ilgili olarak, “Bugüne kadar insan proteomunun elde edilmiş en bütünsel ve doğru resmi olduğuna inanıyoruz,” demektedir. Ayrıca, “Bu çalışmanın, yapay zekanın bilimsel bilginin gelişmesine yaptığı en önemli katkı olduğunu düşünüyorum. Aynı zamanda bu, yapay zekanın topluma katabileceği yararların muhteşem bir örneği” şeklinde eklemektedir.
Proteinler, aminoasit adı verilen daha küçük yapı taşlarının oluşturduğu zincirlerden meydana gelir. Bu zincirler, çeşitli şekillerde katlanarak benzersiz üç boyutlu yapılar oluşturur. Bir proteinin şekli, insan vücudundaki işlevini belirlemektedir. AlphaFold’un tahmin ettiği 350 bin farklı protein yapısından 20 bini, insana özgü proteomda yer almaktadır. Ancak bunun ötesinde, bilimsel araştırmalarda kullanılan model organizmaların (örneğin maya, meyve sineği ve fare gibi) proteinlerinin yapıları da ortaya çıkarılmaktadır.
Prestijli bilim yayını Nature dergisinde, DeepMind araştırmacıları ve Avrupa Moleküler Biyoloji Laboratuvarı’ndan (EMBL) bir ekip, bu çalışma ile ortaya çıkan devasa önemdeki kapasiteyi detaylandırmıştır. Buna göre, AlphaFold, insan proteomunda bulunan aminoasitlerin yüzde 58’inin yapısal pozisyonlarıyla ilgili güvenilir tahminlere ulaşmıştır. Ayrıca, bu tahminlerin yüzde 35,7’sinin doğruluk payı “çok yüksek” olarak belirtilmiştir. Diğer deneylerde bu oran bunun yarısı kadardır.
- Protein yapısı üzerine çalışmak için kullanılan geleneksel teknikler arasında X-ray kristalografisi ve kriyojenik elektron mikroskobisi (Cryo-EM) gibi yöntemler bulunmaktadır.
- Ancak bu yöntemlerle bu çalışmayı yürütmek oldukça zor ve maliyetlidir.
Portsmouth Üniversitesi’nden yapısal biyoloji uzmanı Prof. John McGeehan, “Bu yapıları çalışmak için çok fazla para ve kaynak gerekmektedir” demektedir. Üç boyutlu yapılar genellikle bilimsel incelemelerin hedefi olarak belirlenir, ancak bugüne kadar insan vücudu tarafından üretilen proteinlerin tümünün yapısını sistematik bir şekilde tahmin edebilecek bir proje geliştirilmemiştir. Aslında, proteomların yalnızca yüzde 17’sinin yapısı bugüne kadar deneylerle doğrulanmıştır.
AlphaFold’un tahminleriyle ilgili olarak BBC’ye konuşan Prof. McGeehan, “Bu tamamen hız meselesi. Eskiden tek bir yapıyı incelememiz altı ayımızı alıyordu. Şimdi bu süreç yalnızca birkaç dakika sürüyor. Böyle bir hızın mümkün olabileceğini düşünemezdik,” demektedir. “DeepMind ekibine yedi dizilimi gönderdiğimizde, bunların yalnızca ikisinin yapısı deneysel olarak tahmin edilebiliyordu. Geri döndüklerinde test ettik ve bu, dürüst olmak gerekirse, tüylerimin diken diken olduğu bir andı, çünkü AlphaFold’un ürettiği tüm yapılarla bire bir aynıydı.”
EMBL’den Prof. Edith Heard, “Hayatın nasıl işlediğiyle ilgili anlayışımız için büyük bir dönüşüm niteliği taşıyacak. Çünkü protein, yaşayan organizmaların üzerine inşa edildiği temel yapı taşlarıdır” yorumunu yapmaktadır. Bu dönüşüm sayesinde, artık yeni ilaçlar, bazı hastalıkların tedavileri, iklim değişikliğiyle mücadele için gerekli olan bitkilerin tasarımı ve çevre üzerinde büyük etkiye sahip plastiklerin parçalanması için enzimlerin üretimi gibi uygulamalar da tasarlanabilecektir.
Prof. McGeehan’ın ekibi, AlphaFold’un verilerini plastiklerin parçalanması için daha hızlı enzimler geliştirmek amacıyla kullanıyordu. Çünkü bu program, deneylerle yapısına ulaşılamayan proteinlerin yapısıyla ilgili tahminler sağlayarak projenin birkaç yıl daha hız kazanmasına yardımcı olmuştur. EMBL’nin Avrupa Biyoenformasyon Enstitüsü’nün başındaki Dr. Ewan Birney de AlphaFold’un protein yapısı tahminlerinin “İnsanların gen haritası çıkarıldığından bu yana oluşturulan en önemli veri kümesini oluşturduğunu” ifade etmektedir.
DeepMind ve EMBL, AlphaFold kodunu oluşturmak ve protein yapısı tahminlerinin küresel bilim dünyasına erişimini sağlamak için iş birliği yapmaktadır. Dr. Hassabis, DeepMind’ın, bilim dünyası tarafından bilinen tüm protein dizilimlerini çalışarak veri tabanına eklemeyi planladığını belirtmektedir. Bu da, 100 milyondan fazla yapının anlaşılmasını sağlayacaktır.