Filogenetik Çıkarım
Filogenetik çıkarım, karakter verilerinden evrimsel ağaçları yeniden yapılandırmak için kullanılan yöntemler bütünüdür; benzerlik ve farklılık örüntülerini soy ilişkileri hakkındaki hipotezlere dönüştürmektedir.
Tanım
Filogenetik çıkarım, taksonlar arasındaki evrimsel ilişkilerin kalıtsal karakterlerden, çoğunlukla moleküler dizilerden, tahmin edilmesidir. Açık bir optimallik kriteri veya olasılıksal model altında verileri en iyi açıklayan, dallanma sırası ve bazen dal uzunlukları olan bir ağaç üretmektedir.
Kapsam
Bu konu, başlıca ağaç oluşturma yöntemlerini (uzaklık, parsimoni, maksimum olabilirlik ve Bayesci çıkarım), bu yöntemlerin varsaydığı dizi evrimi modellerini, desteği değerlendirmek için bootstrap ve posterior olasılıkların kullanımını ve çıkarımı yanıltabilecek uzun dal çekimi (long-branch attraction) gibi tuzakları kapsamaktadır.
Temel sorular
- Uzaklık, parsimoni, olabilirlik ve Bayesci yöntemler, ağaç çıkarımında nasıl farklılık göstermektedir?
- DNA dizilerinin dallar boyunca nasıl değiştiğini hangi modeller açıklamaktadır?
- Bir ağaca olan güven, örneğin bootstrap desteği veya posterior olasılık gibi, nasıl değerlendirilmektedir?
- Uzun dal çekimi gibi hangi artefaktlar yanlış ağaçlara neden olabilmektedir?
Temel kuramlar
- Optimalite tabanlı ve model tabanlı ağaç çıkarımı
- Ağaçlar, karakter değişikliklerini en aza indirerek (parsimoni), çiftler arası uzaklıkları uydurarak (uzaklık yöntemleri) veya açık bir ikame modeli altında verilerin olasılığını maksimize ederek (olabilirlik ve Bayesci yöntemler) seçilebilmektedir.
- Desteğin bootstrap ile değerlendirilmesi
- Karakterleri yerine koyarak yeniden örneklemek ve ağaçları yeniden oluşturmak, verilerin her bir kladı ne kadar güçlü desteklediğini tahmin etmekte ve çıkarılan ilişkilerdeki güvenin standart bir ölçüsünü sağlamaktadır.
Mekanizmalar
Komşu birleştirme (neighbor-joining) gibi uzaklık yöntemleri, dizi farklılıklarını bir matrise dönüştürmekte ve kümeleme yoluyla bir ağaç oluşturarak, bilgi kaybı pahasına hız sağlamaktadır. Parsimoni, en az karakter değişikliği gerektiren ağacı seçmektedir. Maksimum olabilirlik ve Bayesci yöntemler, eşit olmayan baz frekansları, transisyon-transversiyon yanlılığı ve bölgeler arası oran varyasyonunu hesaba katan açık ikame modellerini benimsemekte ve verileri en iyi açıklayan ağacı (ve parametreleri) aramaktadır. Destek, olabilirlik ve parsimoni için bootstrap ile veya Bayesci analizde posterior olasılıklarla değerlendirilmektedir. Uzun dal çekimi ve modelin yanlış belirtilmesi, güvenle yanlış ağaçlar üretebilmektedir; bu nedenle yöntem seçimi ve model yeterliliği önem taşımaktadır.
Klinik önem
Filogenetik çıkarım, viral ve bakteriyel bulaşma geçmişlerini yeniden yapılandırmakta, salgınların kaynağını belirlemekte ve dirençli veya virülan suşların ortaya çıkışını tarihlendirmekte olup, genomik epidemiyolojinin temel bir aracı haline gelmektedir.
Tarihçe
Kladistik ve uzaklık yöntemleri 1960'lar-1970'lerde ortaya çıkmıştır; Saitou ve Nei, 1987'de komşu birleştirmeyi (neighbor-joining) tanıtmış, Felsenstein ise diziler için maksimum olabilirliğe ve 1985'te filogeniler için bootstrap'e öncülük etmiştir. Bayesci çıkarım ve giderek büyüyen genomik veri setleri o zamandan beri standart hale gelmiştir.
Tartışmalar
- Parsimoniye karşı model tabanlı yöntemler
- Uzun süredir devam eden metodolojik bir tartışma, özellikle değişim oranları düzensiz olduğunda ve uzun dal çekimi bir risk oluşturduğunda, parsimoninin mi yoksa açık olasılıksal modellerin mi daha güvenilir ağaçlar verdiğine odaklanmaktadır.
Öne çıkan isimler
- Joseph Felsenstein
- Masatoshi Nei
- Naruya Saitou
- Willi Hennig
İlgili konular
Temel eserler
- saitouNei1987
- felsenstein1985
- felsensteinBook2004
Sıkça sorulan sorular
- Hangi yöntem doğru evrimsel ağacı vermektedir?
- Hiçbir yöntemin doğru olduğu garanti edilememektedir; maksimum olabilirlik ve Bayesci çıkarım gibi model tabanlı yöntemler genellikle dizi verileri için tercih edilmekle birlikte, tüm yöntemler düzensiz evrimsel oranlar ve model ihlalleri tarafından yanıltılabilmektedir, bu nedenle destek ölçütleri esastır.
- Bir bootstrap değeri ne anlama gelmektedir?
- Bir bootstrap değeri, veriler yeniden örneklendiğinde ve ağaç yeniden oluşturulduğunda belirli bir gruplamanın ne sıklıkla tekrarlandığını yansıtmaktadır; yüksek değerler, gruplamanın analiz edilen karakterler tarafından güçlü bir şekilde desteklendiğini göstermektedir.