ScholarGate
Asistan

GWAS Tasarımı, Uygulaması ve İstatistiksel Yöntemleri

Genom çapında ilişkilendirme çalışması (GWAS) tasarlamak ve analiz etmek, disiplinli bir süreçtir: iyi fenotiplendirilmiş vaka ve kontrol gruplarının (veya kantitatif özellik kohortunun) bir araya getirilmesi, genom çapında varyantların genotiplenmesi ve imputasyonu, verilerin sıkı kalite kontrolünden geçirilmesi, her bir varyantın soy ağacına göre düzeltme yapılarak ilişkilendirme açısından test edilmesi ve replikasyon aranmadan önce sinyallerin genom çapında bir anlamlılık eşiğine göre değerlendirilmesi gerekmektedir. Her adım, çok sayıda istatistiksel testin yanlış keşifler üretmesini engellemek amacıyla mevcuttur.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

GWAS tasarımı ve analizi, varyant-fenotip ilişkilerinin genom çapında test edildiği, milyonlarca karşılaştırma arasında yanlış pozitiflerin kontrol edildiği ve genotipleme, akrabalık veya soy ağacı artefaktlarından güvenilir sinyallerin ayırt edildiği çalışma tasarım seçimleri ve istatistiksel prosedürler bütünüdür.

Kapsam

Bu konu, bir GWAS'ın metodolojik temelini kapsamaktadır: örneklem ve fenotip tanımı, genotipleme ve imputasyon, kalite kontrol filtreleri, tek belirteçli ilişkilendirme modeli, çoklu test düzeltmesi ve genom çapında anlamlılık, genomik enflasyon faktörü ve QQ/Manhattan grafikleri gibi tanısal araçlar ve replikasyon. Bu bir yöntem referansıdır ve klinik genetik testler için bir protokol değildir.

Temel sorular

  • Küçük etkili varyantları tespit etmek için hangi örneklem büyüklüğü ve fenotip tanımı yeterli gücü sağlamaktadır?
  • Test öncesinde hangi kalite kontrol filtreleri güvenilmez varyantları ve örneklemleri elemektedir?
  • Tek belirteçli ilişkilendirme testi için hangi regresyon modeli kullanılmakta ve soy ağacı nasıl ayarlanmaktadır?
  • Genom çapında yanlış pozitifleri hangi anlamlılık eşiği kontrol etmekte ve neden yaklaşık 5 x 10^-8'dir?
  • Gerçek bir sinyal genomik enflasyondan nasıl ayırt edilmekte ve replikasyon neden gereklidir?

Anahtar kavramlar

  • Vaka-kontrol ve kantitatif özellik tasarımları
  • Genotip çağrısı ve imputasyon
  • Kalite kontrol (çağrı oranı, MAF, Hardy-Weinberg dengesi filtreleri)
  • Tek belirteçli ilişkilendirme testi (lojistik veya doğrusal regresyon)
  • Aditif genetik model ve alel başına etki (olasılık oranı veya beta)
  • Genom çapında anlamlılık eşiği (~5 x 10^-8)
  • Genomik enflasyon faktörü (lambda) ve QQ grafikleri
  • Manhattan grafiği ve replikasyon

Mekanizmalar

Her varyant, genellikle bir regresyon modeli ile test edilmektedir – ikili hastalık durumu için lojistik, kantitatif özellikler için doğrusal bir model kullanılmaktadır. Bu modellerde varyant, aditif (her alel başına) bir model altında kodlanmakta ve karıştırıcı etkiyi (confounding) kontrol etmek amacıyla soy ağacının temel bileşenleri ile diğer kovaryatlar dahil edilmektedir. Her varyant için elde edilen sonuç, bir etki tahmini (olasılık oranı veya beta) ve bir p-değeridir. Yüz binlerce ila milyonlarca büyük ölçüde bağımsız yaygın varyant test edildiği için, anlamlılık, etkili bağımsız test sayısına yönelik Bonferroni tarzı düzeltmeden türetilen yaklaşık 5 x 10^-8'lik bir genom çapında eşiğe göre değerlendirilmektedir. Test öncesinde, kalite kontrol, düşük çağrı oranlarına sahip örneklemleri ve varyantları, kontrol gruplarında Hardy-Weinberg dengesinden aşırı sapma gösterenleri, çok düşük minör alel frekansına sahip olanları veya akrabalık ve popülasyon aykırı değerlerine dair kanıt bulunanları elemektedir. Genomik enflasyon faktörü ve QQ grafikleri, kalıntı karıştırıcı etkiyi (residual confounding) işaret etmektedir; Manhattan grafikleri, genom boyunca sinyalleri göstermektedir; ve bağımsız replikasyon, tasarıma özgü artefaktlara karşı koruma sağlamaktadır. PLINK gibi yazılımlar bu adımları standartlaştırmıştır.

Klinik önem

GWAS tasarımı ve analizini anlamak, hastalık araştırmalarında atıfta bulunulan genetik kanıtları ve poligenik skorların oluşturulmasını değerlendirmenin bir parçasıdır. Bu konu, ilişkilerin nasıl oluşturulduğunu ve doğrulandığını açıklamakta olup betimleyici niteliktedir; bireysel genetik tanı veya klinik karar verme için bir prosedür değildir.

Kanıt ve kılavuzlar

Analitik gelenekler, resmi klinik kılavuzlardan ziyade konsorsiyum deneyimi ve metodolojik derlemeler aracılığıyla pekiştirilmiştir. Wellcome Trust Vaka Kontrol Konsorsiyumu (2007), paylaşımlı kontrol tasarımını ve büyük ölçekte titiz kalite kontrolü göstermiştir; PLINK (Purcell ve ark., 2007) standart bir analiz araç seti haline gelmiştir; ve McCarthy ve ark. (2008) ile Bush ve Moore (2012) tarafından yapılan derlemeler, güç, kalite kontrol, anlamlılık eşikleri ve replikasyon için yaygın olarak kabul gören beklentileri ortaya koymaktadır.

Tarihçe

Bu süreç, 2000'li yılların ortalarında, uygun fiyatlı diziler ve HapMap tabanlı imputasyonun tüm genom testini pratik hale getirmesiyle ilk büyük genom çapında taramalarla belirginleşmiştir. 2007 Wellcome Trust Vaka Kontrol Konsorsiyumu çalışması, paylaşımlı kontroller, kalite kontrol ve 5 x 10^-8 eşiği için etkili emsaller oluştururken, PLINK'in piyasaya sürülmesi topluluğa ortak bir analitik araç seti sağlamıştır. Metodolojik derlemeler daha sonra en iyi uygulamaları kodlamış ve analitik araç seti daha sonra karma modellere, özet istatistik yöntemlerine ve çok büyük biyobank kohortlarına genişlemiştir.

Tartışmalar

Sabit bir 5 x 10^-8 eşiği, farklı çalışma tasarımları ve soy ağaçları için uygun mudur?
Geleneksel genom çapında eşik, Avrupa kökenli örneklemlerdeki yaygın varyasyon için kalibre edilmiştir; daha yoğun dizileme, daha nadir varyantlar ve diğer soy ağaçları, farklı bir etkili bağımsız test sayısı anlamına gelmektedir, bu nedenle eşiğin tasarıma özgü olup olmaması tartışılmaktadır.

Öne çıkan isimler

  • Shaun Purcell
  • Mark McCarthy
  • Jason Moore
  • William Bush
  • Peter Visscher

İlgili konular

Temel eserler

  • wtccc-2007
  • purcell-2007
  • mccarthy-2008

Sıkça sorulan sorular

GWAS anlamlılık eşiği neden yaklaşık 5 x 10^-8 olarak belirlenmektedir?
Bu eşik, insan genomundaki yaklaşık bir milyon etkili bağımsız yaygın varyant için bir Bonferroni düzeltmesini yaklaşık olarak karşılamakta ve genom çapında yanlış pozitif oranını geleneksel 0.05 seviyesine yakın tutmaktadır.
Bir GWAS bulgusu neden replike edilmelidir?
Tek bir çalışma, ince kalite kontrol sorunları, kalıntı karıştırıcı etki (residual confounding) veya anlamlılık sınırındaki şans eseri durumlar nedeniyle yanıltıcı ilişkiler üretebilmektedir; ayrı bir örneklemde bağımsız replikasyon, bir sinyalin gerçek olup olmadığını kontrol etmek için standart bir yöntemdir.

Bu kavram için yöntemler

İlgili kavramlar