Genom Çapında İlişkilendirme Çalışmaları ve Varyant Keşfi
Bir genom çapında ilişkilendirme çalışması (GWAS), bir özellik veya hastalığı olan ve olmayan kişiler arasında alel frekansının sistematik olarak farklılaştığı konumları bulmak amacıyla birçok bireyin genomları genelinde yüz binlerce ila milyonlarca genetik varyantı taramaktadır. Hangi genin ilgili olduğuna dair önceden bir hipotez olmaksızın tüm genomu test ederek, GWAS, yaygın, karmaşık durumların genetik temelini arayışını, aday gen tahmin oyunundan sistematik, hipotezden bağımsız bir keşif girişimine dönüştürmüştür.
Tanım
Bir genom çapında ilişkilendirme çalışması, bir fenotip ile genetik varyantlar – genellikle tek nükleotid polimorfizmleri (single-nucleotide polymorphisms - SNP) – arasındaki ilişkiyi test eden, tüm genom boyunca genotiplenmiş veya impute edilmiş, istatistiksel kanıtları genom çapında bir anlamlılık eşiğini (genome-wide significance threshold) aşan varyantlarda ilişki bildiren gözlemsel bir genetik çalışmadır.
Kapsam
Bu alan, okuyucuyu ilişkisiz popülasyonlarda varyant keşfini çevreleyen yöntemler ve kavramlar ailesine yönlendirmektedir: bir GWAS'ın nasıl tasarlandığı ve analiz edildiği, bağlantı dengesizliğinin (linkage disequilibrium) neden seyrek bir dizinin genotiplenmemiş varyantları etiketlemesine izin verdiği, başlangıçta özellik kalıtımının (trait heritability) büyük bir kısmının neden 'eksik' göründüğü, soy farklılıklarının nasıl yanıltıcı ilişkilendirmeler (spurious associations) yaratabileceği ve nadir varyant yaklaşımlarının keşfi yaygın SNP'lerin ötesine nasıl taşıdığı. Bu konular, genomik içinde metodolojik referans başlıkları olarak ele alınmakta olup, tanısal veya reçeteleyici klinik içerik olarak sunulmamaktadır.
Alt konular
Temel sorular
- Önceden bir aday gen olmaksızın tüm genom, bir özellik ile ilişki açısından nasıl test edilebilir?
- Varyantların bir kısmını genotiplemek, geri kalanı hakkında neden bilgi yakalamaktadır?
- Milyonlarca testte yanlış pozitifleri hangi anlamlılık eşiği kontrol etmektedir?
- İlk GWAS bulguları, tahmini kalıtımın (estimated heritability) neden sadece küçük bir kısmını açıklamıştır?
- Vakalar ve kontroller arasındaki soy farklılıkları, ilişki sinyallerini nasıl bozmaktadır?
Anahtar kavramlar
- Yaygın hastalık, yaygın varyant hipotezi
- Tek nükleotid polimorfizmi (SNP)
- Bağlantı dengesizliği (linkage disequilibrium) ve etiket SNP'ler (tag SNPs)
- Genom çapında anlamlılık eşiği (~5 x 10^-8)
- Referans panellerden genotip imputasyonu
- Poligenik mimari ve etki büyüklükleri
- Popülasyon stratifikasyonu
- Eksik kalıtım (missing heritability)
Mekanizmalar
Bir GWAS, yoğun bir varyant panelini genotipler (veya dizilenmiş bir referans panele karşı impute eder) ve her bir varyantı fenotiple istatistiksel ilişki açısından test eder; bu genellikle soy ve diğer kovaryatları ayarlayan regresyon aracılığıyla yapılmaktadır. Yakındaki varyantlar bağlantı dengesizliği (linkage disequilibrium) blokları halinde birlikte kalıtıldığı için, genotiplenmiş bir belirteç, genotiplenmemiş nedensel varyantlar için bir vekil (etiket) görevi görebilmektedir; bu nedenle bir belirteçteki ilişki, sinyali nedensel varyantın kendisine değil, bir bölgeye lokalize etmektedir. Çok sayıda test, yanlış pozitifleri kontrol etmek için sıkı bir genom çapında anlamlılık eşiği gerektirmektedir ve bulgular bağımsız örneklemlerde replikasyon (doğrulama) ile teyit edilmektedir. Keşfedilen varyantların çoğu yaygındır, bireysel olarak küçük etkilere sahiptir ve sıklıkla kodlamayan düzenleyici bölgelerde bulunmaktadır; bu durum, yaygın özellikler için oldukça poligenik bir mimariyle tutarlıdır.
Klinik önem
GWAS'lar, hastalık biyolojisinin anlaşılmasına, ilaç hedefi önceliklendirmesine ve poligenik skorların oluşturulmasına bilgi sağlayan binlerce sağlam varyant-özellik ilişkisini haritalamıştır. Bir referans alanı olarak, popülasyon ölçeğinde genetik kanıtın nasıl üretildiğini ve yorumlandığını açıklamaktadır; yöntemleri ve bulguları tanımlamakta olup, bireysel tanı, risk danışmanlığı veya tedavi kararları için bir temel oluşturmamaktadır.
Epidemiyoloji
2005-2007 yılları civarındaki ilk çalışma dalgasından bu yana, GWAS'lar, binlerce ila milyonlarca katılımcıdan oluşan kohortlarda yüzlerce hastalığa ve kantitatif özelliğe uygulanmıştır ve NHGRI-EBI GWAS Kataloğu gibi küratörlü veri tabanları (curated repositories) artık on binlerce ilişkiyi kaydetmektedir. Kalıcı bir sınırlama, katılımcıların büyük çoğunluğunun Avrupa kökenli (European ancestry) olmasıdır; bu durum, bulguların ve poligenik skorların diğer popülasyonlara aktarılabilirliğini kısıtlamaktadır.
Kanıt ve kılavuzlar
GWAS için metodolojik standartlar, klinik uygulama kılavuzlarından ziyade büyük konsorsiyum çabaları ve derleme sentezleri aracılığıyla pekiştirilmiştir. Wellcome Trust Vaka Kontrol Konsorsiyumu çalışması (2007), paylaşılan kontrollü, çoklu hastalık tasarımının kanonik bir göstergesidir ve McCarthy ve ark. (2008) ile Visscher ve ark. (2012, 2017) tarafından yazılan derleme makaleleri, anlamlılık eşikleri, kalite kontrolü, replikasyon ve yorumlama konularında konsensüs beklentilerini dile getirmektedir.
Tarihçe
Bu yaklaşım, yoğun SNP haritaları ve HapMap projesi genom çapında bağlantı dengesizliğini (linkage disequilibrium) karakterize ettikten sonra ve 2000'li yılların ortalarında uygun fiyatlı genotipleme dizileri ortaya çıktıktan sonra uygulanabilir hale gelmiştir. 2007 Wellcome Trust Vaka Kontrol Konsorsiyumu çalışması, yedi yaygın hastalığı paylaşılan kontrollere karşı test ederek tasarımı büyük ölçekte göstermiş ve ilişkilendirme haritalamasının hızlı bir şekilde genişlemesini katalize etmiştir. Sonraki derlemeler, alanın birkaç lokustan genom çapında kataloglara doğru olgunlaşmasını ve eksik kalıtım (missing heritability), popülasyon çeşitliliği ve nadir varyant ile tüm genom dizileme çalışmalarına doğru yönelişini ele almıştır.
Tartışmalar
- Yaygın özellik kalıtımının ne kadarı GWAS tarafından geri kazanılabilir?
- İlk GWAS lokusları, tahmini kalıtımın yalnızca küçük bir kısmını açıklamıştır; bu durum, bu boşluğun birçok tespit edilememiş küçük etkili yaygın varyantı, nadir varyantları, yapısal varyasyonu veya aşırı tahmin edilmiş kalıtımı yansıtıp yansıtmadığına dair bir tartışmayı tetiklemiştir; daha sonraki tüm genom yöntemleri bu boşluğu daraltmış ancak kapatamamıştır.
- GWAS'ın Avrupa kökenli yanlılığı, eşitliği ve geçerliliği sınırlamakta mıdır?
- Katılımcıların çoğunun Avrupa kökenli olması nedeniyle, keşfedilen ilişkilendirmeler ve poligenik skorlar diğer popülasyonlara kusurlu bir şekilde aktarılmaktadır; bu durum hem genellenebilirlik (generalizability) hakkında bilimsel endişeleri hem de genomik tıptan kimlerin faydalandığına dair eşitlik endişelerini gündeme getirmektedir.
Öne çıkan isimler
- Peter Visscher
- Mark McCarthy
- Joel Hirschhorn
- Naomi Wray
- Jian Yang
İlgili konular
Temel eserler
- wtccc-2007
- mccarthy-2008
- visscher-2012
- visscher-2017
Sıkça sorulan sorular
- GWAS ile bağlantı çalışması (linkage study) arasındaki fark nedir?
- Bağlantı çalışmaları, aileler içinde belirteçlerin ve hastalığın birlikte ayrışmasını (co-segregation) takip eder ve geniş kromozomal bölgeleri konumlandırırken, bir GWAS ilişkisiz bireyler arasında ince genom çapında çözünürlükte ilişkiyi test etmektedir; bu da onu küçük etkili yaygın varyantlar için daha uygun hale getirmektedir.
- GWAS'lar neden bu kadar sıkı bir anlamlılık eşiği kullanmaktadır?
- Milyonlarca varyant test edildiği için, 0.05'lik geleneksel bir p-değeri çok sayıda yanlış pozitif sonuç verecektir; 5 x 10^-8 civarındaki genom çapında bir eşik, genom boyunca bağımsız yaygın varyasyonun ima ettiği çoklu testi (multiple testing) hesaba katmaktadır.