ScholarGate
Ассистент

Неравновесное сцепление и тагирующие однонуклеотидные полиморфизмы (SNP)

Неравновесное сцепление (НС) — это неслучайное совместное встречаемость аллелей в различных позициях генома: варианты, расположенные близко друг к другу, как правило, наследуются вместе в виде гаплотипических блоков. Эта корреляция делает полногеномные исследования ассоциаций доступными — массив генотипирования должен типировать лишь подмножество тщательно отобранных «тагирующих» SNP, поскольку каждый таг статистически представляет нетипированные варианты, с которыми он находится в сильном неравновесном сцеплении.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Неравновесное сцепление — это статистическая ассоциация между аллелями в двух или более локусах — их совместное встречаемость на гаплотипах чаще или реже, чем ожидалось, если бы они были независимыми, — а тагирование SNP — это использование подмножества вариантов, которые посредством НС охватывают вариации нетипированных соседних участков.

Scope

Эта тема объясняет, что такое НС, как оно измеряется (D' и r-квадрат), почему оно образует блоки, формируемые рекомбинацией и популяционной историей, как выбираются тагирующие SNP для эффективного выявления общих вариаций, и как НС как позволяет картировать ассоциации, так и усложняет локализацию причинных вариантов. Это методологический справочник, а не клиническое руководство.

Core questions

  • Что означает, что два варианта находятся в неравновесном сцеплении?
  • Как D' и r-квадрат используются для количественной оценки НС, и чем они отличаются?
  • Почему геном делится на гаплотипические блоки, и что определяет их границы?
  • Как выбираются тагирующие SNP, чтобы массив охватывал большинство общих вариаций?
  • Почему НС затрудняет идентификацию фактического причинного варианта в ассоциированной области?

Key concepts

  • Гаплотип и гаплотипический блок
  • D' (нормализованный коэффициент неравновесия)
  • r-квадрат (корреляция между маркерами)
  • Горячие точки рекомбинации
  • Выбор тагирующих SNP
  • Референсные гаплотипические панели (HapMap, 1000 Genomes)
  • Тонкое картирование и неоднозначность причинного варианта

Mechanisms

Аллели в близлежащих локусах наследуются вместе до тех пор, пока рекомбинация не разделит их, поэтому на протяжении поколений НС ослабевает с генетическим расстоянием и разрушается в горячих точках рекомбинации, образуя блоки с высокой внутренней корреляцией. Его количественно оценивают две общие меры: D' показывает, произошла ли рекомбинация между двумя участками, в то время как r-квадрат измеряет, насколько хорошо один вариант предсказывает другой, и напрямую определяет потерю мощности, когда тагирующий SNP замещает нетипированный причинный вариант. Поскольку варианты внутри блока сильно коррелированы, массив может генотипировать выбранный набор тагирующих SNP и выявить большинство общих вариаций, а отсутствующие варианты могут быть статистически импутированы с использованием секвенированных референсных панелей, таких как HapMap и 1000 Genomes Project. Та же корреляция, которая позволяет тагировать, также означает, что сигнал ассоциации распределяется между многими вариантами в блоке, поэтому для идентификации истинного причинного варианта требуется дополнительное тонкое картирование, а не просто выбор наиболее значимого маркера.

Clinical relevance

Структура НС лежит в основе того, как генерируются полногеномные генетические данные и как интерпретируются области ассоциации в исследованиях заболеваний. Эта тема описывает метод и популяционную генетику; она не является основой для индивидуального генетического тестирования или клинической интерпретации.

Evidence & guidelines

Знание структуры НС человека основано на крупных референсных ресурсах, а не на клинических рекомендациях. Проект International HapMap (2007) картировал полногеномное НС и тагирующие SNP, проект 1000 Genomes (2015) расширил референсные гаплотипы для различных популяций, а обзоры, такие как Slatkin (2008) и Bush and Moore (2012), объясняют, как меры НС и тагирование применяются в картировании ассоциаций.

History

Концепция аллельной ассоциации предшествует геномике, но ее практическая значимость возросла с открытием в начале 2000-х годов того, что геном человека имеет блочную гаплотипическую структуру, сформированную горячими точками рекомбинации. Проект HapMap затем каталогизировал НС по всему геному и сделал возможным выбор тагирующих SNP, что непосредственно позволило создать первые доступные массивы для GWAS. Проект 1000 Genomes позже расширил референсные панели для многих популяций, улучшив импутацию и выявив, как паттерны НС различаются в зависимости от происхождения.

Debates

Передаются ли паттерны НС между популяциями?
Гаплотипическая структура и НС варьируются в зависимости от популяционной истории, поэтому тагирующие SNP и панели импутации, оптимизированные для одной этнической группы, неточно выявляют вариации в другой, что способствует снижению эффективности массивов и показателей, полученных от европейских популяций, в других популяциях.

Key figures

  • Montgomery Slatkin
  • Mark Daly
  • David Altshuler
  • Goncalo Abecasis
  • William Bush

Related topics

Seminal works

  • slatkin-2008
  • hapmap-2007
  • 1000g-2015

Frequently asked questions

Как неравновесное сцепление позволяет GWAS типировать только некоторые варианты?
Поскольку варианты в гаплотипическом блоке сильно коррелированы, генотипированный тагирующий SNP несет информацию о своих нетипированных соседях, поэтому массив хорошо выбранных тагов охватывает большинство общих вариаций в геноме.
В чем разница между D' и r-квадратом?
D' измеряет, исторически ли рекомбинация разделяла два аллеля, в то время как r-квадрат измеряет, насколько хорошо один вариант статистически предсказывает другой; r-квадрат является величиной, наиболее релевантной для мощности тестирования ассоциаций на основе тагирующих SNP.

Methods for this concept

Related concepts