Desequilibrio de ligamiento y etiquetado de SNP
El desequilibrio de ligamiento (DL) es la coocurrencia no aleatoria de alelos en diferentes posiciones del genoma: las variantes cercanas entre sí tienden a heredarse juntas como bloques de haplotipos. Esta correlación es lo que hace que los estudios de asociación de genoma completo sean asequibles: un chip de genotipado solo necesita tipificar un subconjunto de SNP 'etiqueta' cuidadosamente seleccionados, porque cada etiqueta representa estadísticamente las variantes no tipificadas con las que se encuentra en un fuerte DL.
Definition
El desequilibrio de ligamiento es la asociación estadística entre alelos en dos o más loci —su coocurrencia en haplotipos con mayor o menor frecuencia de lo esperado si fueran independientes— y el etiquetado de SNP es el uso de un subconjunto de variantes que, a través del DL, capturan la variación de sitios vecinos no tipificados.
Scope
Este tema explica qué es el DL, cómo se mide (D' y r-cuadrado), por qué forma bloques modelados por la recombinación y la historia poblacional, cómo se seleccionan los SNP etiqueta para capturar la variación común de manera eficiente, y cómo el DL tanto permite el mapeo de asociación como complica la localización de variantes causales. Es una referencia metodológica, no una guía clínica.
Core questions
- ¿Qué significa que dos variantes estén en desequilibrio de ligamiento?
- ¿Cómo se utilizan D' y r-cuadrado para cuantificar el DL, y en qué se diferencian?
- ¿Por qué el genoma se organiza en bloques de haplotipos, y qué determina sus límites?
- ¿Cómo se seleccionan los SNP etiqueta para que un chip capture la mayor parte de la variación común?
- ¿Por qué el DL dificulta la identificación de la variante causal real dentro de una región asociada?
Key concepts
- Haplotipo y bloque de haplotipos
- D' (coeficiente de desequilibrio normalizado)
- r-cuadrado (correlación entre marcadores)
- Puntos calientes de recombinación
- Selección de SNP etiqueta
- Paneles de haplotipos de referencia (HapMap, 1000 Genomes)
- Mapeo fino y ambigüedad de variantes causales
Mechanisms
Los alelos en loci cercanos se heredan juntos hasta que la recombinación los separa, por lo que a lo largo de las generaciones el DL disminuye con la distancia genética y se interrumpe en los puntos calientes de recombinación, produciendo bloques de alta correlación interna. Dos medidas comunes lo cuantifican: D' captura si ha ocurrido recombinación entre dos sitios, mientras que r-cuadrado mide qué tan bien una variante predice a otra y rige directamente la potencia perdida cuando un SNP etiqueta representa una variante causal no tipificada. Debido a que las variantes dentro de un bloque están fuertemente correlacionadas, un chip puede genotipar un conjunto elegido de SNP etiqueta y recuperar la mayor parte de la variación común, y las variantes faltantes pueden imputarse estadísticamente utilizando paneles de referencia secuenciados como HapMap y el Proyecto 1000 Genomas. La misma correlación que permite el etiquetado también significa que una señal de asociación se comparte entre muchas variantes en un bloque, por lo que identificar la verdadera variante causal requiere un mapeo fino adicional en lugar de simplemente tomar el marcador más significativo.
Clinical relevance
La estructura del DL subyace a cómo se genera la evidencia genética a nivel del genoma y cómo se interpretan las regiones de asociación en la investigación de enfermedades. Este tema es descriptivo de la metodología y la genética de poblaciones; no es una base para pruebas genéticas individuales o interpretación clínica.
Evidence & guidelines
El conocimiento de la estructura del DL humano se basa en grandes recursos de referencia en lugar de guías clínicas. El Proyecto Internacional HapMap (2007) mapeó el DL y los SNP etiqueta a nivel del genoma, el Proyecto 1000 Genomas (2015) extendió los haplotipos de referencia a través de diversas poblaciones, y revisiones como las de Slatkin (2008) y Bush y Moore (2012) explican cómo se aplican las medidas de DL y el etiquetado en el mapeo de asociación.
History
El concepto de asociación alélica es anterior a la genómica, pero su importancia práctica creció con el descubrimiento a principios de la década de 2000 de que el genoma humano tiene una estructura de haplotipos en bloques, modelada por puntos calientes de recombinación. El Proyecto HapMap catalogó entonces el DL a nivel del genoma y hizo factible la selección de SNP etiqueta, lo que permitió directamente los primeros chips de GWAS asequibles. El Proyecto 1000 Genomas amplió posteriormente los paneles de referencia a muchas poblaciones, mejorando la imputación y revelando cómo los patrones de DL difieren según la ascendencia.
Debates
- ¿Los patrones de DL se transfieren entre poblaciones?
- La estructura de haplotipos y el DL varían con la historia poblacional, por lo que los SNP etiqueta y los paneles de imputación optimizados en una ascendencia capturan la variación de manera imperfecta en otra, lo que contribuye a la reducción del rendimiento de los chips y puntuaciones derivados de poblaciones europeas en otras poblaciones.
Key figures
- Montgomery Slatkin
- Mark Daly
- David Altshuler
- Goncalo Abecasis
- William Bush
Related topics
Seminal works
- slatkin-2008
- hapmap-2007
- 1000g-2015
Frequently asked questions
- ¿Cómo permite el desequilibrio de ligamiento que un GWAS tipifique solo algunas variantes?
- Debido a que las variantes en un bloque de haplotipos están fuertemente correlacionadas, un SNP etiqueta genotipado lleva información sobre sus vecinos no tipificados, por lo que un chip de etiquetas bien elegidas captura la mayor parte de la variación común en el genoma.
- ¿Cuál es la diferencia entre D' y r-cuadrado?
- D' mide si la recombinación ha separado históricamente dos alelos, mientras que r-cuadrado mide qué tan bien una variante predice estadísticamente a otra; r-cuadrado es la cantidad más relevante para la potencia de las pruebas de asociación basadas en SNP etiqueta.