Почему популяционная стратификация вызывает ложные ассоциации?

Когда случаи и контроли различаются по происхождению, варианты, которые просто различаются по частоте между группами происхождения, могут выглядеть связанными с заболеванием всякий раз, когда риск заболевания также различается по происхождению, поэтому ассоциация отражает смешение по происхождению, а не причинно-следственный эффект варианта.

Как современные исследования корректируют популяционную структуру?

Распространенные подходы оценивают происхождение по полногеномным данным и корректируют его, например, путем включения главных компонент происхождения в качестве ковариат, применения геномного контроля для масштабирования тестовых статистик или использования смешанных моделей, учитывающих родство и структуру.

Популяционная стратификация и адмикс

Популяционная стратификация — это наличие систематических различий в генетическом происхождении между сравниваемыми группами в генетическом исследовании, а адмикс — это смешение происхождений внутри индивидуумов из ранее разделенных популяций. Оба явления создают популяционную структуру, которая может искажать результаты генетических ассоциативных исследований, генерируя ложные связи между вариантом и заболеванием просто потому, что частота аллелей и риск заболевания различаются в зависимости от происхождения.

Найти тему в PaperMindСкороFind papers & topics

Tools & resources

Скачать слайды

Learn & explore

ВидеоСкоро

Definition

Популяционная стратификация — это смешивающий фактор в генетическом ассоциативном исследовании, вызванный различиями в происхождении между группами, при котором частоты аллелей и риск заболевания варьируются в субпопуляциях; адмикс — это наличие у индивидуумов генетического происхождения от двух или более исторически различных популяций, что является связанным источником структуры.

Scope

Тема охватывает вопросы возникновения популяционной структуры, причины ее искажающего влияния на генетические ассоциативные исследования типа «случай-контроль», а также основные методы, используемые для ее выявления и корректировки. Она представлена как методологический аспект в генетической эпидемиологии, касающийся валидности исследования, а не как утверждение о биологии или ранжировании человеческих популяционных групп.

Core questions

Взяты ли сравниваемые группы в генетическом исследовании из одной и той же базовой популяции?
Может ли кажущаяся ассоциация вариант-заболевание быть объяснена происхождением, а не причинно-следственной связью?
Как можно выявить популяционную структуру по генетическим данным?
Как можно скорректировать ассоциативные тесты, чтобы структура не увеличивала количество ложноположительных результатов?

Key concepts

Смешение по происхождению
Популяционная структура и субструктура
Адмикс
Различия в частоте аллелей
Геномный контроль
Анализ главных компонент происхождения
Смешанные модели для родства

Mechanisms

Если случаи и контроли в ассоциативном исследовании различаются по происхождению, любой вариант, частота которого различается между этими группами происхождения, будет казаться связанным с заболеванием всякий раз, когда риск заболевания также различается между группами, даже если вариант не играет причинной роли. Это классическое смешение, где генетическое происхождение выступает в качестве смешивающего фактора. Методы решают эту проблему путем измерения и корректировки происхождения: геномный контроль масштабирует тестовые статистики с использованием фактора инфляции, оцененного по множеству маркеров; анализ главных компонент суммирует происхождение из полногеномных генотипов и включает эти компоненты в качестве ковариат; а смешанные модели учитывают как широкую структуру, так и скрытое родство. Адмикс, при котором индивидуумы имеют смешанное происхождение, может быть обработан с помощью связанных подходов, которые оценивают локальное или глобальное происхождение.

Clinical relevance

Контроль популяционной структуры необходим для валидности доказательств генетической ассоциации, которые лежат в основе понимания риска хронических заболеваний, поскольку неконтролируемая стратификация может приводить к ложным ассоциациям, вводящим в заблуждение последующие исследования. В качестве справочной темы эта статья объясняет угрозу валидности исследования и способы ее устранения; она не предоставляет рекомендаций по индивидуальному генетическому тестированию или интерпретации.

Epidemiology

Обеспокоенность стратификацией возросла по мере увеличения масштабов генетических ассоциативных исследований, поскольку даже незначительные различия в происхождении между случаями и контролями могут увеличивать частоту ложноположительных результатов среди множества вариантов, тестируемых в полногеномном исследовании. Разработка геномного контроля, а затем и корректировки с использованием главных компонент и смешанных моделей сделала возможными крупномасштабные ассоциативные исследования с участием различных групп происхождения, сохраняя при этом контролируемый уровень ложноположительных результатов.

History

Осознание того, что происхождение может искажать результаты ассоциативных исследований, предшествовало геномной эре, но практические решения появились в конце 1990-х и 2000-х годах. Притчард и Розенберг предложили использовать несвязанные маркеры для выявления стратификации, Девлин и Родер ввели геномный контроль для коррекции завышенных тестовых статистик, а Прайс и коллеги в 2006 году показали, что анализ главных компонент может эффективно корректировать стратификацию в полногеномных ассоциативных исследованиях, и этот подход стал стандартной практикой.

Debates

Насколько полно статистическая корректировка может устранить смешение по происхождению?: Геномный контроль, главные компоненты и смешанные модели уменьшают инфляцию, вызванную популяционной структурой, но продолжаются дебаты по поводу остаточного смешения от мелкомасштабной или недавней структуры и того, насколько хорошо эти коррекции переносятся на разнообразные и смешанные популяции.

Key figures

Jonathan Pritchard
Noah Rosenberg
Bernie Devlin
Kathryn Roeder
Alkes Price
David Reich

Seminal works

pritchard-rosenberg-1999
devlin-roeder-1999
price-2006

Frequently asked questions

Почему популяционная стратификация вызывает ложные ассоциации?: Когда случаи и контроли различаются по происхождению, варианты, которые просто различаются по частоте между группами происхождения, могут выглядеть связанными с заболеванием всякий раз, когда риск заболевания также различается по происхождению, поэтому ассоциация отражает смешение по происхождению, а не причинно-следственный эффект варианта.
Как современные исследования корректируют популяционную структуру?: Распространенные подходы оценивают происхождение по полногеномным данным и корректируют его, например, путем включения главных компонент происхождения в качестве ковариат, применения геномного контроля для масштабирования тестовых статистик или использования смешанных моделей, учитывающих родство и структуру.