ScholarGate
Ассистент

Полногеномный поиск ассоциаций и обнаружение вариантов

Полногеномный поиск ассоциаций (GWAS) сканирует сотни тысяч или миллионы генетических вариантов в геномах множества индивидуумов для выявления позиций, где частота аллелей систематически различается между людьми с определённым признаком или заболеванием и без него. Тестируя весь геном без предварительной гипотезы о вовлечённости конкретного гена, GWAS превратил поиск генетической основы распространённых, сложных состояний из угадывания генов-кандидатов в систематический, не зависящий от гипотез процесс открытия.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Полногеномный поиск ассоциаций — это обсервационное генетическое исследование, которое проверяет ассоциацию между фенотипом и генетическими вариантами (обычно однонуклеотидными полиморфизмами), генотипированными или импутированными по всему геному, объявляя ассоциацию для вариантов, статистические доказательства которых выдерживают пороговое значение полногеномной значимости.

Scope

Эта область знакомит читателя с семейством методов и концепций, связанных с обнаружением вариантов в неродственных популяциях: как разрабатывается и анализируется GWAS, почему неравновесное сцепление позволяет разреженному массиву «метить» нетипированные варианты, почему большая часть наследуемости признаков изначально казалась «недостающей», как различия в происхождении могут создавать ложные ассоциации и как подходы, основанные на редких вариантах, расширяют область открытий за пределы распространённых однонуклеотидных полиморфизмов (SNP). Эти темы рассматриваются как методологические справочные вопросы в рамках геномики, а не как диагностический или предписывающий клинический контент.

Sub-topics

Core questions

  • Как можно протестировать весь геном на ассоциацию с признаком без предварительного кандидата гена?
  • Почему генотипирование части вариантов позволяет получить информацию об остальных?
  • Какой порог значимости контролирует ложноположительные результаты среди миллионов тестов?
  • Почему ранние результаты GWAS объясняли лишь малую долю предполагаемой наследуемости?
  • Как различия в происхождении между случаями и контролями искажают сигналы ассоциации?

Key concepts

  • Гипотеза общих заболеваний, общих вариантов
  • Однонуклеотидный полиморфизм (SNP)
  • Неравновесное сцепление и таг-SNP
  • Порог полногеномной значимости (~5 x 10^-8)
  • Импутация генотипов из референсных панелей
  • Полигенная архитектура и размеры эффектов
  • Популяционная стратификация
  • Недостающая наследуемость

Mechanisms

GWAS генотипирует плотную панель вариантов (или импутирует их по секвенированной референсной панели) и тестирует каждый вариант на статистическую ассоциацию с фенотипом, обычно с помощью регрессии, которая корректируется с учётом происхождения и других ковариат. Поскольку близлежащие варианты совместно наследуются в блоках неравновесного сцепления, типированный маркер может выступать в качестве прокси (метки) для нетипированных причинных вариантов, поэтому ассоциация с маркером локализует сигнал в определённой области, а не обязательно в самом причинном варианте. Огромное количество тестов требует строгого порога полногеномной значимости для контроля ложноположительных результатов, а полученные данные подтверждаются репликацией в независимых выборках. Большинство обнаруженных вариантов являются распространёнными, имеют индивидуально малый эффект и часто находятся в некодирующих регуляторных областях, что согласуется с высокополигенной архитектурой распространённых признаков.

Clinical relevance

GWAS выявили тысячи надёжных ассоциаций между вариантами и признаками, которые способствуют пониманию биологии заболеваний, приоритизации мишеней для лекарств и построению полигенных оценок. Как справочная область, она объясняет, как генетические данные популяционного масштаба генерируются и интерпретируются; она описывает методы и результаты и не является основой для индивидуальной диагностики, консультирования по рискам или принятия решений о лечении.

Epidemiology

С момента первой волны исследований около 2005–2007 годов GWAS были применены к сотням заболеваний и количественных признаков в когортах от тысяч до миллионов участников, а курируемые репозитории, такие как Каталог GWAS NHGRI-EBI, теперь регистрируют десятки тысяч ассоциаций. Постоянным ограничением является то, что подавляющее большинство участников имели европейское происхождение, что ограничивает переносимость результатов и полигенных оценок на другие популяции.

Evidence & guidelines

Методологические стандарты для GWAS были консолидированы благодаря крупным консорциумным усилиям и обзорным синтезам, а не клиническим рекомендациям. Исследование Wellcome Trust Case Control Consortium (2007) является канонической демонстрацией дизайна с общим контролем и множеством заболеваний, а обзорные статьи McCarthy et al. (2008) и Visscher et al. (2012, 2017) формулируют консенсусные ожидания относительно порогов значимости, контроля качества, репликации и интерпретации.

History

Подход стал осуществимым после того, как плотные карты SNP и проект HapMap охарактеризовали полногеномное неравновесное сцепление, и после появления доступных массивов для генотипирования в середине 2000-х годов. Исследование Wellcome Trust Case Control Consortium 2007 года, тестировавшее семь распространённых заболеваний против общих контролей, продемонстрировало дизайн в масштабе и катализировало быстрое расширение картирования ассоциаций. Последующие обзоры отслеживали созревание области от нескольких локусов до полногеномных каталогов и её осмысление недостающей наследуемости, популяционного разнообразия и перехода к исследованиям редких вариантов и полногеномного секвенирования.

Debates

Какую часть наследуемости общих признаков может восстановить GWAS?
Ранние локусы, выявленные GWAS, объясняли лишь малую долю предполагаемой наследуемости, что вызвало дебаты о том, отражает ли этот разрыв множество необнаруженных распространённых вариантов с малым эффектом, редкие варианты, структурные вариации или переоценённую наследуемость; более поздние полногеномные методы сузили, но не закрыли этот разрыв.
Ограничивает ли предвзятость GWAS в отношении европейского происхождения справедливость и валидность?
Поскольку большинство участников имели европейское происхождение, обнаруженные ассоциации и полигенные оценки неидеально переносятся на другие популяции, что вызывает как научные опасения относительно обобщаемости, так и этические опасения относительно того, кто получает выгоду от геномной медицины.

Key figures

  • Peter Visscher
  • Mark McCarthy
  • Joel Hirschhorn
  • Naomi Wray
  • Jian Yang

Related topics

Seminal works

  • wtccc-2007
  • mccarthy-2008
  • visscher-2012
  • visscher-2017

Frequently asked questions

В чём разница между GWAS и исследованием сцепления?
Исследования сцепления отслеживают совместное наследование маркеров и заболеваний внутри семей и локализуют широкие хромосомные области, тогда как GWAS проверяет ассоциацию между неродственными индивидуумами с высоким полногеномным разрешением, что делает его более подходящим для распространённых вариантов с малым эффектом.
Почему GWAS использует такой строгий порог значимости?
Поскольку тестируются миллионы вариантов, обычное p-значение 0,05 привело бы к огромному количеству ложноположительных результатов; полногеномный порог около 5 x 10^-8 учитывает множественное тестирование, подразумеваемое независимой распространённой вариацией по всему геному.

Methods for this concept

Related concepts