Неравновесное сцепление и тагирующие однонуклеотидные полиморфизмы (SNP)
Неравновесное сцепление (НС) — это неслучайное совместное встречаемость аллелей в различных позициях генома: варианты, расположенные близко друг к другу, как правило, наследуются вместе в виде гаплотипических блоков. Эта корреляция делает полногеномные исследования ассоциаций доступными — массив генотипирования должен типировать лишь подмножество тщательно отобранных «тагирующих» SNP, поскольку каждый таг статистически представляет нетипированные варианты, с которыми он находится в сильном неравновесном сцеплении.
Definition
Неравновесное сцепление — это статистическая ассоциация между аллелями в двух или более локусах — их совместное встречаемость на гаплотипах чаще или реже, чем ожидалось, если бы они были независимыми, — а тагирование SNP — это использование подмножества вариантов, которые посредством НС охватывают вариации нетипированных соседних участков.
Scope
Эта тема объясняет, что такое НС, как оно измеряется (D' и r-квадрат), почему оно образует блоки, формируемые рекомбинацией и популяционной историей, как выбираются тагирующие SNP для эффективного выявления общих вариаций, и как НС как позволяет картировать ассоциации, так и усложняет локализацию причинных вариантов. Это методологический справочник, а не клиническое руководство.
Core questions
- Что означает, что два варианта находятся в неравновесном сцеплении?
- Как D' и r-квадрат используются для количественной оценки НС, и чем они отличаются?
- Почему геном делится на гаплотипические блоки, и что определяет их границы?
- Как выбираются тагирующие SNP, чтобы массив охватывал большинство общих вариаций?
- Почему НС затрудняет идентификацию фактического причинного варианта в ассоциированной области?
Key concepts
- Гаплотип и гаплотипический блок
- D' (нормализованный коэффициент неравновесия)
- r-квадрат (корреляция между маркерами)
- Горячие точки рекомбинации
- Выбор тагирующих SNP
- Референсные гаплотипические панели (HapMap, 1000 Genomes)
- Тонкое картирование и неоднозначность причинного варианта
Mechanisms
Аллели в близлежащих локусах наследуются вместе до тех пор, пока рекомбинация не разделит их, поэтому на протяжении поколений НС ослабевает с генетическим расстоянием и разрушается в горячих точках рекомбинации, образуя блоки с высокой внутренней корреляцией. Его количественно оценивают две общие меры: D' показывает, произошла ли рекомбинация между двумя участками, в то время как r-квадрат измеряет, насколько хорошо один вариант предсказывает другой, и напрямую определяет потерю мощности, когда тагирующий SNP замещает нетипированный причинный вариант. Поскольку варианты внутри блока сильно коррелированы, массив может генотипировать выбранный набор тагирующих SNP и выявить большинство общих вариаций, а отсутствующие варианты могут быть статистически импутированы с использованием секвенированных референсных панелей, таких как HapMap и 1000 Genomes Project. Та же корреляция, которая позволяет тагировать, также означает, что сигнал ассоциации распределяется между многими вариантами в блоке, поэтому для идентификации истинного причинного варианта требуется дополнительное тонкое картирование, а не просто выбор наиболее значимого маркера.
Clinical relevance
Структура НС лежит в основе того, как генерируются полногеномные генетические данные и как интерпретируются области ассоциации в исследованиях заболеваний. Эта тема описывает метод и популяционную генетику; она не является основой для индивидуального генетического тестирования или клинической интерпретации.
Evidence & guidelines
Знание структуры НС человека основано на крупных референсных ресурсах, а не на клинических рекомендациях. Проект International HapMap (2007) картировал полногеномное НС и тагирующие SNP, проект 1000 Genomes (2015) расширил референсные гаплотипы для различных популяций, а обзоры, такие как Slatkin (2008) и Bush and Moore (2012), объясняют, как меры НС и тагирование применяются в картировании ассоциаций.
History
Концепция аллельной ассоциации предшествует геномике, но ее практическая значимость возросла с открытием в начале 2000-х годов того, что геном человека имеет блочную гаплотипическую структуру, сформированную горячими точками рекомбинации. Проект HapMap затем каталогизировал НС по всему геному и сделал возможным выбор тагирующих SNP, что непосредственно позволило создать первые доступные массивы для GWAS. Проект 1000 Genomes позже расширил референсные панели для многих популяций, улучшив импутацию и выявив, как паттерны НС различаются в зависимости от происхождения.
Debates
- Передаются ли паттерны НС между популяциями?
- Гаплотипическая структура и НС варьируются в зависимости от популяционной истории, поэтому тагирующие SNP и панели импутации, оптимизированные для одной этнической группы, неточно выявляют вариации в другой, что способствует снижению эффективности массивов и показателей, полученных от европейских популяций, в других популяциях.
Key figures
- Montgomery Slatkin
- Mark Daly
- David Altshuler
- Goncalo Abecasis
- William Bush
Related topics
Seminal works
- slatkin-2008
- hapmap-2007
- 1000g-2015
Frequently asked questions
- Как неравновесное сцепление позволяет GWAS типировать только некоторые варианты?
- Поскольку варианты в гаплотипическом блоке сильно коррелированы, генотипированный тагирующий SNP несет информацию о своих нетипированных соседях, поэтому массив хорошо выбранных тагов охватывает большинство общих вариаций в геноме.
- В чем разница между D' и r-квадратом?
- D' измеряет, исторически ли рекомбинация разделяла два аллеля, в то время как r-квадрат измеряет, насколько хорошо один вариант статистически предсказывает другой; r-квадрат является величиной, наиболее релевантной для мощности тестирования ассоциаций на основе тагирующих SNP.
Methods for this concept
Related concepts
- Неравновесие по сцеплению
- Гаплотипические блоки и структурная организация на популяционном уровне
- Полногеномный поиск ассоциаций и обнаружение вариантов
- Картирование локусов количественных признаков (QTL) и сложных признаков
- Сцепление, рекомбинация и картирование генов
- Популяционная стратификация и происхождение в GWAS