Популяционная стратификация и генетическое разнообразие человека
Генетическое разнообразие человека структурировано: частоты аллелей закономерно варьируются в зависимости от географии и происхождения, так что популяции дифференцированы, а не представляют собой единый неразделенный пул. Популяционная стратификация относится к этой структуре и к систематической ошибке, которую она может внести в генетические исследования, когда случаи и контроли систематически различаются по происхождению.
Definition
Популяционная стратификация — это наличие систематических различий в частотах аллелей между субпопуляциями в выборке, возникающих из-за различного происхождения; генетическое разнообразие здесь относится к тому, как это разнообразие распределяется внутри и между человеческими популяциями.
Scope
Статья охватывает меры генетической дифференциации между популяциями, общую картину мирового разнообразия человека и стратификацию как смешивающий фактор в ассоциативных исследованиях, а также методы, используемые для ее обнаружения и коррекции. Это методологическая и описательная тема, которая избегает какой-либо клинической или социальной интерпретации популяционных категорий.
Core questions
- Как количественно оценивается генетическая дифференциация между популяциями?
- Как распределяется генетическая изменчивость человека внутри популяций и между ними?
- Как популяционная стратификация искажает результаты генетических ассоциативных исследований?
- Как стратификация обнаруживается и корректируется статистически?
Key concepts
- F-статистики и FST
- Внутрипопуляционное и межпопуляционное разнообразие
- Изоляция по расстоянию
- Главные компоненты происхождения
- Смешивающие факторы в ассоциативных исследованиях
- Референсные популяционные панели
Key theories
- F-статистики и распределение разнообразия
- Иерархические F-статистики Райта (Wright), формализованные для оценки Неем (Nei), а также Вейром (Weir) и Кокерхэмом (Cockerham), разделяют генетическую дисперсию на внутрипопуляционные и межпопуляционные компоненты; FST суммирует долю общего разнообразия, обусловленную различиями между популяциями, и является стандартной мерой дифференциации.
Mechanisms
Дифференциация накапливается по мере того, как дрейф, ограниченная миграция и локальный отбор приводят к расхождению частот аллелей между популяциями; доля общего разнообразия, обусловленная межпопуляционными различиями, выражается показателем FST. У человека большая часть генетической изменчивости находится внутри популяций, с меньшим, но структурированным компонентом между ними, который отслеживает географию. В ассоциативных исследованиях, если происхождение различается между случаями и контролями, а также коррелирует с частотой аллелей, возникают ложные ассоциации; для обнаружения и корректировки этой стратификации используются методы, которые суммируют происхождение, в частности, анализ главных компонент полногеномных генотипов.
Clinical relevance
Учет популяционной структуры необходим для достоверности генетических ассоциативных исследований, которые формируют медицинские знания, поскольку нескорректированная стратификация может порождать ложные ассоциации. Осведомленность о разнообразии также влияет на переносимость геномных данных между популяциями. Эта статья описывает популяционную структуру как методологическое соображение и не является основанием для принятия индивидуальных диагностических или лечебных решений.
Evidence & guidelines
Оценка дифференциации основывается на анализе генетического разнообразия Нея (Nei's gene-diversity analysis) и F-статистиках Вейра-Кокерхэма (Weir-Cockerham F-statistics), в то время как полногеномные исследования мирового разнообразия человека и крупные референсные панели описывают эмпирическую структуру человеческого разнообразия. Коррекция методом главных компонент является стандартным методом для устранения стратификации в ассоциативных исследованиях.
History
Райт (Wright) ввел F-статистики для описания структурированных популяций, а Ней (Nei), а затем Вейр (Weir) и Кокерхэм (Cockerham) предоставили практические оценки. Дебаты о том, как распределяется человеческая изменчивость, восходят к работе Левонтина (Lewontin) в 1970-х годах; полногеномное генотипирование позднее подробно картировало мировые человеческие взаимоотношения, и методы главных компонент стали стандартными для контроля стратификации после появления больших наборов данных генотипов.
Key figures
- Sewall Wright
- Masatoshi Nei
- Bruce Weir
- David Reich
- Alkes Price
Related topics
Seminal works
- nei-1973
- weir-cockerham-1984
- price-2006
Frequently asked questions
- Что на самом деле измеряет FST?
- FST — это доля общего генетического разнообразия, которая обусловлена различиями в частотах аллелей между популяциями, а не изменчивостью внутри них; значения, близкие к нулю, указывают на небольшую дифференциацию, а большие значения — на большую.
- Почему популяционная стратификация является проблемой в ассоциативных исследованиях?
- Если доля различных происхождений различается между случаями и контролями, любой вариант, частота которого также варьируется в зависимости от происхождения, может казаться связанным с признаком, даже если он не играет причинной роли, поэтому стратификация должна быть обнаружена и скорректирована.