Bağlantı dengesizliği, bir GWAS'ın neden sadece bazı varyantları tiplemesine olanak tanımaktadır?

Bir haplotip bloğundaki varyantlar güçlü bir şekilde ilişkili olduğundan, genotiplenmiş bir etiket SNP'si, tiplenmemiş komşuları hakkında bilgi taşımaktadır, bu nedenle iyi seçilmiş etiketlerden oluşan bir dizi, genomdaki en yaygın varyasyonu yakalamaktadır.

D' ve r-kare arasındaki fark nedir?

D', rekombinasyonun tarihsel olarak iki aleli ayırıp ayırmadığını ölçerken, r-kare bir varyantın diğerini istatistiksel olarak ne kadar iyi tahmin ettiğini ölçmektedir; r-kare, etiket-SNP tabanlı ilişkilendirme testinin gücüyle en alakalı niceliktir.

Bağlantı Dengesizliği ve SNP Etiketlemesi

Bağlantı dengesizliği (LD), genomdaki farklı konumlardaki alellerin rastgele olmayan birlikte ortaya çıkmasıdır: birbirine yakın varyantlar, haplotip blokları olarak birlikte kalıtılma eğilimindedir. Bu korelasyon, genom çapında ilişkilendirme çalışmalarını uygun maliyetli hale getirmektedir — bir genotipleme dizisi yalnızca dikkatlice seçilmiş 'etiket' SNP'lerin bir alt kümesini tiplemelidir, çünkü her etiket, güçlü LD içinde olduğu tiplenmemiş varyantlar için istatistiksel olarak bir temsilci görevi görmektedir.

PaperMind ile konu bulYakındaMakale ve konu bul

Tools & resources

Slaytları indir

Learn & explore

VideoYakında

Tanım

Bağlantı dengesizliği, iki veya daha fazla lokustaki aleller arasındaki istatistiksel ilişkilendirmedir — bağımsız olmaları durumunda beklenenden daha fazla veya daha az sıklıkla haplotip üzerinde birlikte bulunmalarıdır — ve SNP etiketlemesi, LD aracılığıyla tiplenmemiş komşu bölgelerin varyasyonunu yakalayan bir varyant alt kümesinin kullanılmasıdır.

Kapsam

Bu konu, LD'nin ne olduğunu, nasıl ölçüldüğünü (D' ve r-kare), rekombinasyon ve popülasyon geçmişi tarafından şekillenen blokları neden oluşturduğunu, yaygın varyasyonu verimli bir şekilde yakalamak için etiket SNP'lerinin nasıl seçildiğini ve LD'nin hem ilişkilendirme haritalamasını nasıl mümkün kıldığını hem de nedensel varyantların lokalizasyonunu nasıl karmaşıklaştırdığını açıklamaktadır. Bu, metodolojik bir referanstır, klinik bir rehberlik değildir.

Temel sorular

İki varyantın bağlantı dengesizliği içinde olması ne anlama gelmektedir?
D' ve r-kare, LD'yi nicelendirmek için nasıl kullanılmaktadır ve aralarındaki farklar nelerdir?
Genom neden haplotip bloklarına ayrılmaktadır ve bunların sınırlarını ne belirlemektedir?
Bir dizinin en yaygın varyasyonu yakalaması için etiket SNP'leri nasıl seçilmektedir?
LD, ilişkili bir bölge içindeki gerçek nedensel varyantı tanımlamayı neden zorlaştırmaktadır?

Anahtar kavramlar

Haplotip ve haplotip bloğu
D' (normalleştirilmiş dengesizlik katsayısı)
r-kare (belirteçler arasındaki korelasyon)
Rekombinasyon sıcak noktaları
Etiket SNP seçimi
Referans haplotip panelleri (HapMap, 1000 Genom)
İnce haritalama ve nedensel varyant belirsizliği

Mekanizmalar

Yakın lokuslardaki aleller, rekombinasyon onları ayırana kadar birlikte kalıtılır, bu nedenle nesiller boyunca LD, genetik mesafe ile azalır ve rekombinasyon sıcak noktalarında parçalanarak yüksek iç korelasyona sahip bloklar üretir. İki yaygın ölçü bunu nicelendirir: D', iki bölge arasında rekombinasyonun meydana gelip gelmediğini yakalarken, r-kare bir varyantın diğerini ne kadar iyi tahmin ettiğini ölçer ve bir etiket SNP'nin tiplenmemiş nedensel bir varyantı temsil etmesi durumunda kaybedilen gücü doğrudan belirler. Bir blok içindeki varyantlar güçlü bir şekilde ilişkili olduğundan, bir dizi seçilen bir etiket SNP kümesini genotipleştirebilir ve çoğu yaygın varyasyonu geri kazanabilir ve eksik varyantlar, HapMap ve 1000 Genom Projesi gibi dizilenmiş referans panellerine karşı istatistiksel olarak impute edilebilir. Etiketlemeyi mümkün kılan aynı korelasyon, bir ilişkilendirme sinyalinin bir bloktaki birçok varyant arasında paylaşıldığı anlamına da gelmektedir, bu nedenle gerçek nedensel varyantı tanımlamak, sadece en anlamlı belirteci almak yerine ek ince haritalama gerektirmektedir.

Klinik önem

LD yapısı, genom çapında genetik kanıtın nasıl üretildiğinin ve hastalık araştırmalarında ilişkilendirme bölgelerinin nasıl yorumlandığının temelini oluşturmaktadır. Bu konu, yöntem ve popülasyon genetiğini tanımlayıcı niteliktedir; bireysel genetik test veya klinik yorumlama için bir temel değildir.

Kanıt ve kılavuzlar

İnsan LD yapısı bilgisi, klinik kılavuzlardan ziyade büyük referans kaynaklarına dayanmaktadır. Uluslararası HapMap Projesi (2007) genom çapında LD ve etiket SNP'lerini haritalamış, 1000 Genom Projesi (2015) referans haplotip panellerini çeşitli popülasyonlara genişletmiş ve Slatkin (2008) ile Bush ve Moore (2012) gibi derlemeler, LD ölçümlerinin ve etiketlemenin ilişkilendirme haritalamasında nasıl uygulandığını açıklamaktadır.

Tarihçe

Alelsel ilişkilendirme kavramı genomikten önceye dayanmaktadır, ancak pratik önemi, 2000'li yılların başında insan genomunun rekombinasyon sıcak noktaları tarafından şekillenen blok benzeri bir haplotip yapısına sahip olduğunun keşfedilmesiyle artmıştır. HapMap Projesi daha sonra genom çapında LD'yi kataloglamış ve etiket-SNP seçimini mümkün kılmış, bu da ilk uygun maliyetli GWAS dizilerini doğrudan sağlamıştır. 1000 Genom Projesi daha sonra referans panellerini birçok popülasyona genişleterek imputasyonu iyileştirmiş ve LD paternlerinin soy ağacına göre nasıl farklılık gösterdiğini ortaya koymuştur.

Tartışmalar

LD paternleri popülasyonlar arasında aktarılmakta mıdır?: Haplotip yapısı ve LD, popülasyon geçmişine göre değişmektedir, bu nedenle bir soy ağacında optimize edilmiş etiket SNP'leri ve imputasyon panelleri, başka bir soy ağacında varyasyonu kusurlu bir şekilde yakalamakta, bu da Avrupa kökenli dizilerin ve skorların diğer popülasyonlarda azalan performansına katkıda bulunmaktadır.

Öne çıkan isimler

Montgomery Slatkin
Mark Daly
David Altshuler
Goncalo Abecasis
William Bush

İlgili konular

Temel eserler

slatkin-2008
hapmap-2007
1000g-2015

Sıkça sorulan sorular

Bağlantı dengesizliği, bir GWAS'ın neden sadece bazı varyantları tiplemesine olanak tanımaktadır?: Bir haplotip bloğundaki varyantlar güçlü bir şekilde ilişkili olduğundan, genotiplenmiş bir etiket SNP'si, tiplenmemiş komşuları hakkında bilgi taşımaktadır, bu nedenle iyi seçilmiş etiketlerden oluşan bir dizi, genomdaki en yaygın varyasyonu yakalamaktadır.
D' ve r-kare arasındaki fark nedir?: D', rekombinasyonun tarihsel olarak iki aleli ayırıp ayırmadığını ölçerken, r-kare bir varyantın diğerini istatistiksel olarak ne kadar iyi tahmin ettiğini ölçmektedir; r-kare, etiket-SNP tabanlı ilişkilendirme testinin gücüyle en alakalı niceliktir.