Популяционная стратификация и адмикс
Популяционная стратификация — это наличие систематических различий в генетическом происхождении между сравниваемыми группами в генетическом исследовании, а адмикс — это смешение происхождений внутри индивидуумов из ранее разделенных популяций. Оба явления создают популяционную структуру, которая может искажать результаты генетических ассоциативных исследований, генерируя ложные связи между вариантом и заболеванием просто потому, что частота аллелей и риск заболевания различаются в зависимости от происхождения.
Definition
Популяционная стратификация — это смешивающий фактор в генетическом ассоциативном исследовании, вызванный различиями в происхождении между группами, при котором частоты аллелей и риск заболевания варьируются в субпопуляциях; адмикс — это наличие у индивидуумов генетического происхождения от двух или более исторически различных популяций, что является связанным источником структуры.
Scope
Тема охватывает вопросы возникновения популяционной структуры, причины ее искажающего влияния на генетические ассоциативные исследования типа «случай-контроль», а также основные методы, используемые для ее выявления и корректировки. Она представлена как методологический аспект в генетической эпидемиологии, касающийся валидности исследования, а не как утверждение о биологии или ранжировании человеческих популяционных групп.
Core questions
- Взяты ли сравниваемые группы в генетическом исследовании из одной и той же базовой популяции?
- Может ли кажущаяся ассоциация вариант-заболевание быть объяснена происхождением, а не причинно-следственной связью?
- Как можно выявить популяционную структуру по генетическим данным?
- Как можно скорректировать ассоциативные тесты, чтобы структура не увеличивала количество ложноположительных результатов?
Key concepts
- Смешение по происхождению
- Популяционная структура и субструктура
- Адмикс
- Различия в частоте аллелей
- Геномный контроль
- Анализ главных компонент происхождения
- Смешанные модели для родства
Mechanisms
Если случаи и контроли в ассоциативном исследовании различаются по происхождению, любой вариант, частота которого различается между этими группами происхождения, будет казаться связанным с заболеванием всякий раз, когда риск заболевания также различается между группами, даже если вариант не играет причинной роли. Это классическое смешение, где генетическое происхождение выступает в качестве смешивающего фактора. Методы решают эту проблему путем измерения и корректировки происхождения: геномный контроль масштабирует тестовые статистики с использованием фактора инфляции, оцененного по множеству маркеров; анализ главных компонент суммирует происхождение из полногеномных генотипов и включает эти компоненты в качестве ковариат; а смешанные модели учитывают как широкую структуру, так и скрытое родство. Адмикс, при котором индивидуумы имеют смешанное происхождение, может быть обработан с помощью связанных подходов, которые оценивают локальное или глобальное происхождение.
Clinical relevance
Контроль популяционной структуры необходим для валидности доказательств генетической ассоциации, которые лежат в основе понимания риска хронических заболеваний, поскольку неконтролируемая стратификация может приводить к ложным ассоциациям, вводящим в заблуждение последующие исследования. В качестве справочной темы эта статья объясняет угрозу валидности исследования и способы ее устранения; она не предоставляет рекомендаций по индивидуальному генетическому тестированию или интерпретации.
Epidemiology
Обеспокоенность стратификацией возросла по мере увеличения масштабов генетических ассоциативных исследований, поскольку даже незначительные различия в происхождении между случаями и контролями могут увеличивать частоту ложноположительных результатов среди множества вариантов, тестируемых в полногеномном исследовании. Разработка геномного контроля, а затем и корректировки с использованием главных компонент и смешанных моделей сделала возможными крупномасштабные ассоциативные исследования с участием различных групп происхождения, сохраняя при этом контролируемый уровень ложноположительных результатов.
History
Осознание того, что происхождение может искажать результаты ассоциативных исследований, предшествовало геномной эре, но практические решения появились в конце 1990-х и 2000-х годах. Притчард и Розенберг предложили использовать несвязанные маркеры для выявления стратификации, Девлин и Родер ввели геномный контроль для коррекции завышенных тестовых статистик, а Прайс и коллеги в 2006 году показали, что анализ главных компонент может эффективно корректировать стратификацию в полногеномных ассоциативных исследованиях, и этот подход стал стандартной практикой.
Debates
- Насколько полно статистическая корректировка может устранить смешение по происхождению?
- Геномный контроль, главные компоненты и смешанные модели уменьшают инфляцию, вызванную популяционной структурой, но продолжаются дебаты по поводу остаточного смешения от мелкомасштабной или недавней структуры и того, насколько хорошо эти коррекции переносятся на разнообразные и смешанные популяции.
Key figures
- Jonathan Pritchard
- Noah Rosenberg
- Bernie Devlin
- Kathryn Roeder
- Alkes Price
- David Reich
Related topics
Seminal works
- pritchard-rosenberg-1999
- devlin-roeder-1999
- price-2006
Frequently asked questions
- Почему популяционная стратификация вызывает ложные ассоциации?
- Когда случаи и контроли различаются по происхождению, варианты, которые просто различаются по частоте между группами происхождения, могут выглядеть связанными с заболеванием всякий раз, когда риск заболевания также различается по происхождению, поэтому ассоциация отражает смешение по происхождению, а не причинно-следственный эффект варианта.
- Как современные исследования корректируют популяционную структуру?
- Распространенные подходы оценивают происхождение по полногеномным данным и корректируют его, например, путем включения главных компонент происхождения в качестве ковариат, применения геномного контроля для масштабирования тестовых статистик или использования смешанных моделей, учитывающих родство и структуру.