Полногеномный поиск ассоциаций и обнаружение вариантов
Полногеномный поиск ассоциаций (GWAS) сканирует сотни тысяч или миллионы генетических вариантов в геномах множества индивидуумов для выявления позиций, где частота аллелей систематически различается между людьми с определённым признаком или заболеванием и без него. Тестируя весь геном без предварительной гипотезы о вовлечённости конкретного гена, GWAS превратил поиск генетической основы распространённых, сложных состояний из угадывания генов-кандидатов в систематический, не зависящий от гипотез процесс открытия.
Definition
Полногеномный поиск ассоциаций — это обсервационное генетическое исследование, которое проверяет ассоциацию между фенотипом и генетическими вариантами (обычно однонуклеотидными полиморфизмами), генотипированными или импутированными по всему геному, объявляя ассоциацию для вариантов, статистические доказательства которых выдерживают пороговое значение полногеномной значимости.
Scope
Эта область знакомит читателя с семейством методов и концепций, связанных с обнаружением вариантов в неродственных популяциях: как разрабатывается и анализируется GWAS, почему неравновесное сцепление позволяет разреженному массиву «метить» нетипированные варианты, почему большая часть наследуемости признаков изначально казалась «недостающей», как различия в происхождении могут создавать ложные ассоциации и как подходы, основанные на редких вариантах, расширяют область открытий за пределы распространённых однонуклеотидных полиморфизмов (SNP). Эти темы рассматриваются как методологические справочные вопросы в рамках геномики, а не как диагностический или предписывающий клинический контент.
Sub-topics
Core questions
- Как можно протестировать весь геном на ассоциацию с признаком без предварительного кандидата гена?
- Почему генотипирование части вариантов позволяет получить информацию об остальных?
- Какой порог значимости контролирует ложноположительные результаты среди миллионов тестов?
- Почему ранние результаты GWAS объясняли лишь малую долю предполагаемой наследуемости?
- Как различия в происхождении между случаями и контролями искажают сигналы ассоциации?
Key concepts
- Гипотеза общих заболеваний, общих вариантов
- Однонуклеотидный полиморфизм (SNP)
- Неравновесное сцепление и таг-SNP
- Порог полногеномной значимости (~5 x 10^-8)
- Импутация генотипов из референсных панелей
- Полигенная архитектура и размеры эффектов
- Популяционная стратификация
- Недостающая наследуемость
Mechanisms
GWAS генотипирует плотную панель вариантов (или импутирует их по секвенированной референсной панели) и тестирует каждый вариант на статистическую ассоциацию с фенотипом, обычно с помощью регрессии, которая корректируется с учётом происхождения и других ковариат. Поскольку близлежащие варианты совместно наследуются в блоках неравновесного сцепления, типированный маркер может выступать в качестве прокси (метки) для нетипированных причинных вариантов, поэтому ассоциация с маркером локализует сигнал в определённой области, а не обязательно в самом причинном варианте. Огромное количество тестов требует строгого порога полногеномной значимости для контроля ложноположительных результатов, а полученные данные подтверждаются репликацией в независимых выборках. Большинство обнаруженных вариантов являются распространёнными, имеют индивидуально малый эффект и часто находятся в некодирующих регуляторных областях, что согласуется с высокополигенной архитектурой распространённых признаков.
Clinical relevance
GWAS выявили тысячи надёжных ассоциаций между вариантами и признаками, которые способствуют пониманию биологии заболеваний, приоритизации мишеней для лекарств и построению полигенных оценок. Как справочная область, она объясняет, как генетические данные популяционного масштаба генерируются и интерпретируются; она описывает методы и результаты и не является основой для индивидуальной диагностики, консультирования по рискам или принятия решений о лечении.
Epidemiology
С момента первой волны исследований около 2005–2007 годов GWAS были применены к сотням заболеваний и количественных признаков в когортах от тысяч до миллионов участников, а курируемые репозитории, такие как Каталог GWAS NHGRI-EBI, теперь регистрируют десятки тысяч ассоциаций. Постоянным ограничением является то, что подавляющее большинство участников имели европейское происхождение, что ограничивает переносимость результатов и полигенных оценок на другие популяции.
Evidence & guidelines
Методологические стандарты для GWAS были консолидированы благодаря крупным консорциумным усилиям и обзорным синтезам, а не клиническим рекомендациям. Исследование Wellcome Trust Case Control Consortium (2007) является канонической демонстрацией дизайна с общим контролем и множеством заболеваний, а обзорные статьи McCarthy et al. (2008) и Visscher et al. (2012, 2017) формулируют консенсусные ожидания относительно порогов значимости, контроля качества, репликации и интерпретации.
History
Подход стал осуществимым после того, как плотные карты SNP и проект HapMap охарактеризовали полногеномное неравновесное сцепление, и после появления доступных массивов для генотипирования в середине 2000-х годов. Исследование Wellcome Trust Case Control Consortium 2007 года, тестировавшее семь распространённых заболеваний против общих контролей, продемонстрировало дизайн в масштабе и катализировало быстрое расширение картирования ассоциаций. Последующие обзоры отслеживали созревание области от нескольких локусов до полногеномных каталогов и её осмысление недостающей наследуемости, популяционного разнообразия и перехода к исследованиям редких вариантов и полногеномного секвенирования.
Debates
- Какую часть наследуемости общих признаков может восстановить GWAS?
- Ранние локусы, выявленные GWAS, объясняли лишь малую долю предполагаемой наследуемости, что вызвало дебаты о том, отражает ли этот разрыв множество необнаруженных распространённых вариантов с малым эффектом, редкие варианты, структурные вариации или переоценённую наследуемость; более поздние полногеномные методы сузили, но не закрыли этот разрыв.
- Ограничивает ли предвзятость GWAS в отношении европейского происхождения справедливость и валидность?
- Поскольку большинство участников имели европейское происхождение, обнаруженные ассоциации и полигенные оценки неидеально переносятся на другие популяции, что вызывает как научные опасения относительно обобщаемости, так и этические опасения относительно того, кто получает выгоду от геномной медицины.
Key figures
- Peter Visscher
- Mark McCarthy
- Joel Hirschhorn
- Naomi Wray
- Jian Yang
Related topics
- Дизайн, выполнение и статистические методы GWAS
- Неравновесное сцепление и тагирующие однонуклеотидные полиморфизмы (SNP)
- Недостающая наследуемость и полигенная архитектура
- Популяционная стратификация и происхождение в GWAS
- Выявление редких вариантов и нагрузочное тестирование
- Геномика и функциональная геномика
Seminal works
- wtccc-2007
- mccarthy-2008
- visscher-2012
- visscher-2017
Frequently asked questions
- В чём разница между GWAS и исследованием сцепления?
- Исследования сцепления отслеживают совместное наследование маркеров и заболеваний внутри семей и локализуют широкие хромосомные области, тогда как GWAS проверяет ассоциацию между неродственными индивидуумами с высоким полногеномным разрешением, что делает его более подходящим для распространённых вариантов с малым эффектом.
- Почему GWAS использует такой строгий порог значимости?
- Поскольку тестируются миллионы вариантов, обычное p-значение 0,05 привело бы к огромному количеству ложноположительных результатов; полногеномный порог около 5 x 10^-8 учитывает множественное тестирование, подразумеваемое независимой распространённой вариацией по всему геному.
Methods for this concept
Related concepts
- Дизайн, выполнение и статистические методы GWAS
- Генетическая основа предрасположенности к заболеваниям
- Недостающая наследуемость и полигенная архитектура
- Генетическая основа комплексных заболеваний
- Неравновесное сцепление и тагирующие однонуклеотидные полиморфизмы (SNP)
- Картирование локусов количественных признаков (QTL) и сложных признаков