Popülasyon Tabakalaşması ve Karışım
Popülasyon tabakalaşması, bir genetik çalışmanın karşılaştırılan grupları arasında genetik köken açısından sistematik farklılıkların bulunmasıdır; karışım ise, daha önce ayrılmış popülasyonlardan gelen bireylerde kökenlerin karışmasıdır. Her ikisi de genetik ilişkilendirme çalışmalarını karıştırıcı etki (confounding) ile etkileyebilecek popülasyon yapısı oluşturarak, sadece alel frekansı ve hastalık riskinin kökene göre farklılık göstermesi nedeniyle bir varyant ile bir hastalık arasında sahte bağlantılar üretebilmektedir.
Tanım
Popülasyon tabakalaşması, bir genetik ilişkilendirme çalışmasında gruplar arasındaki köken farklılıklarından kaynaklanan karıştırıcı etki (confounding) olarak tanımlanmaktadır; bu durumda alel frekansları ve hastalık riski alt popülasyonlar arasında farklılık göstermektedir. Karışım ise, bireylerde iki veya daha fazla tarihsel olarak farklı popülasyondan genetik kökenin bulunmasıdır ve bu da ilgili bir yapı kaynağıdır.
Kapsam
Bu konu, popülasyon yapısının nasıl ortaya çıktığını, vaka-kontrol genetik ilişkilendirme çalışmalarını neden karıştırıcı etki (confounding) ile etkilediğini ve bunu tespit etmek ve düzeltmek için kullanılan başlıca yöntemleri kapsamaktadır. Konu, genetik epidemiyolojide metodolojik bir konu olarak — çalışma geçerliliği ile ilgilidir — sunulmakta olup, insan popülasyon gruplarının biyolojisi veya sıralaması hakkında bir ifade olarak ele alınmamaktadır.
Temel sorular
- Bir genetik çalışmadaki karşılaştırılan gruplar aynı temel popülasyondan mı gelmektedir?
- Görünen bir varyant-hastalık ilişkisi nedensellikten ziyade kökenle açıklanabilir mi?
- Popülasyon yapısı genetik verilerden nasıl tespit edilebilir?
- İlişkilendirme testleri, yapının yanlış pozitifleri artırmaması için nasıl ayarlanabilir?
Anahtar kavramlar
- Köken kaynaklı karıştırıcı etki (confounding)
- Popülasyon yapısı ve alt yapısı
- Karışım
- Alel frekansı farklılıkları
- Genomik kontrol
- Kökenin ana bileşenler analizi
- Akrabalık için karışık modeller
Mekanizmalar
Bir ilişkilendirme çalışmasındaki vaka ve kontrol grupları köken açısından farklılık gösteriyorsa, bu atalardan kalma gruplar arasında frekansı farklı olan herhangi bir varyant, hastalık riski de gruplar arasında farklılık gösterdiğinde, varyantın nedensel bir rolü olmasa bile hastalıkla ilişkili gibi görünecektir. Bu, genetik kökenin karıştırıcı etki (confounding) faktörü olduğu klasik bir karıştırıcı etkidir. Yöntemler, kökeni ölçerek ve ayarlayarak bu durumu ele almaktadır: genomik kontrol, birçok belirteçten tahmin edilen bir enflasyon faktörü kullanarak test istatistiklerini yeniden ölçeklendirmektedir; ana bileşenler analizi, genom çapında genotiplerden kökeni özetlemekte ve bu bileşenleri kovaryat olarak dahil etmektedir; ve karışık modeller hem geniş yapıyı hem de kriptik akrabalığı hesaba katmaktadır. Bireylerin karışık köken taşıdığı karışım durumu, yerel veya küresel kökeni tahmin eden ilgili yaklaşımlarla ele alınabilmektedir.
Klinik önem
Popülasyon yapısının kontrol edilmesi, kronik hastalık riskinin anlaşılmasına bilgi sağlayan genetik ilişkilendirme kanıtlarının geçerliliği için esastır, çünkü kontrolsüz tabakalaşma, sonraki araştırmaları yanıltabilecek yanlış ilişkilendirmeler üretebilmektedir. Bir referans konusu olarak bu madde, çalışma geçerliliğine yönelik bir tehdidi ve bunun nasıl ele alındığını açıklamaktadır; bireysel genetik test veya yorumlama için rehberlik sağlamamaktadır.
Epidemiyoloji
Genetik ilişkilendirme çalışmaları ölçeklendikçe tabakalaşma konusundaki endişeler artmıştır, çünkü vaka ve kontrol grupları arasındaki mütevazı köken farklılıkları bile, genom çapında bir çalışmada test edilen birçok varyanttaki yanlış pozitif oranlarını artırabilmektedir. Genomik kontrolün ve ardından ana bileşenler ile karışık model ayarlamalarının geliştirilmesi, yanlış pozitif oranlarını kontrol altında tutarken büyük çoklu kökenli ilişkilendirme çalışmalarını mümkün kılmıştır.
Tarihçe
Kökenin ilişkilendirme çalışmalarını karıştırıcı etki (confounding) ile etkileyebileceği farkındalığı genomik çağdan öncesine dayanmaktadır, ancak pratik çözümler 1990'ların sonları ve 2000'lerde ortaya çıkmıştır. Pritchard ve Rosenberg, tabakalaşmayı tespit etmek için bağlantısız belirteçler kullanmayı önermiştir. Devlin ve Roeder, şişirilmiş test istatistiklerini düzeltmek için genomik kontrolü tanıtmıştır. Price ve meslektaşları ise 2006'da ana bileşenler analizinin genom çapında ilişkilendirme çalışmalarında tabakalaşmayı verimli bir şekilde düzeltebileceğini göstermiştir; bu yaklaşım standart bir uygulama haline gelmiştir.
Tartışmalar
- İstatistiksel ayarlama, köken kaynaklı karıştırıcı etkiyi (confounding) ne kadar tamamen ortadan kaldırabilir?
- Genomik kontrol, ana bileşenler ve karışık modeller popülasyon yapısından kaynaklanan enflasyonu azaltmaktadır, ancak ince ölçekli veya yakın zamandaki yapıdan kaynaklanan kalıntı karıştırıcı etki (confounding) ve bu düzeltmelerin çeşitli ve karışık popülasyonlarda ne kadar iyi aktarıldığı konusunda tartışmalar devam etmektedir.
Öne çıkan isimler
- Jonathan Pritchard
- Noah Rosenberg
- Bernie Devlin
- Kathryn Roeder
- Alkes Price
- David Reich
İlgili konular
Temel eserler
- pritchard-rosenberg-1999
- devlin-roeder-1999
- price-2006
Sıkça sorulan sorular
- Popülasyon tabakalaşması neden yanlış ilişkilendirmelere yol açar?
- Vaka ve kontrol grupları köken açısından farklılık gösterdiğinde, atalardan kalma gruplar arasında frekansı farklı olan varyantlar, hastalık riski de kökene göre farklılık gösterdiğinde hastalıkla ilişkili gibi görünebilir; bu nedenle ilişki, varyantın nedensel bir etkisinden ziyade köken kaynaklı karıştırıcı etkiyi (confounding) yansıtmaktadır.
- Modern çalışmalar popülasyon yapısını nasıl düzeltir?
- Yaygın yaklaşımlar, genom çapında verilerden kökeni tahmin etmekte ve bunu düzeltmektedir; örneğin, kökenin ana bileşenlerini kovaryat olarak dahil ederek, test istatistiklerini yeniden ölçeklendirmek için genomik kontrol uygulayarak veya akrabalık ve yapıyı hesaba katan karışık modeller kullanarak.