Estudios de Asociación de Genoma Completo y Descubrimiento de Variantes
Un estudio de asociación de genoma completo (GWAS) analiza cientos de miles a millones de variantes genéticas a lo largo de los genomas de muchos individuos para encontrar posiciones donde la frecuencia alélica difiere sistemáticamente entre personas con y sin un rasgo o enfermedad. Al examinar el genoma completo sin una hipótesis previa sobre qué gen está implicado, los GWAS transformaron la búsqueda de la base genética de condiciones comunes y complejas de un juego de adivinanzas de genes candidatos en una empresa de descubrimiento sistemática y libre de hipótesis.
Definition
Un estudio de asociación de genoma completo es un estudio genético observacional que evalúa la asociación entre un fenotipo y variantes genéticas —típicamente polimorfismos de un solo nucleótido— genotipadas o imputadas a lo largo de todo el genoma, declarando asociación en variantes cuya evidencia estadística supera un umbral de significación a nivel de genoma completo.
Scope
Esta área orienta al lector sobre la familia de métodos y conceptos que rodean el descubrimiento de variantes en poblaciones no relacionadas: cómo se diseña y analiza un GWAS, por qué el desequilibrio de ligamiento permite que un conjunto disperso etiquete variantes no tipificadas, por qué gran parte de la heredabilidad de los rasgos inicialmente parecía 'perdida', cómo las diferencias de ascendencia pueden crear asociaciones espurias, y cómo los enfoques de variantes raras extienden el descubrimiento más allá de los SNP comunes. Esto los enmarca como temas de referencia metodológicos dentro de la genómica, no como contenido clínico diagnóstico o prescriptivo.
Sub-topics
Core questions
- ¿Cómo se puede evaluar la asociación del genoma completo con un rasgo sin un gen candidato previo?
- ¿Por qué el genotipado de una fracción de variantes captura información sobre el resto?
- ¿Qué umbral de significación controla los falsos positivos en millones de pruebas?
- ¿Por qué los primeros hallazgos de GWAS explicaron solo una pequeña parte de la heredabilidad estimada?
- ¿Cómo distorsionan las diferencias de ascendencia entre casos y controles las señales de asociación?
Key concepts
- Hipótesis de enfermedad común, variante común
- Polimorfismo de un solo nucleótido (SNP)
- Desequilibrio de ligamiento y SNPs etiqueta
- Umbral de significación a nivel de genoma completo (~5 x 10^-8)
- Imputación de genotipos a partir de paneles de referencia
- Arquitectura poligénica y tamaños del efecto
- Estratificación poblacional
- Heredabilidad perdida
Mechanisms
Un GWAS genotipa un panel denso de variantes (o las imputa utilizando un panel de referencia secuenciado) y evalúa cada variante en busca de asociación estadística con el fenotipo, generalmente mediante regresión que ajusta por ascendencia y otras covariables. Debido a que las variantes cercanas se co-heredan en bloques de desequilibrio de ligamiento, un marcador tipificado puede actuar como un proxy (etiqueta) para variantes causales no tipificadas, por lo que la asociación en un marcador localiza una señal en una región en lugar de necesariamente en la variante causal misma. El enorme número de pruebas requiere un umbral de significación estricto a nivel de genoma completo para controlar los falsos positivos, y los hallazgos se confirman mediante replicación en muestras independientes. La mayoría de las variantes descubiertas son comunes, de efecto individualmente pequeño y frecuentemente se encuentran en regiones reguladoras no codificantes, lo que es consistente con una arquitectura altamente poligénica para rasgos comunes.
Clinical relevance
Los GWAS han mapeado miles de asociaciones robustas variante-rasgo que informan la comprensión de la biología de las enfermedades, la priorización de dianas farmacológicas y la construcción de puntuaciones poligénicas. Como área de referencia, explica cómo se genera e interpreta la evidencia genética a escala poblacional; describe métodos y hallazgos y no constituye una base para el diagnóstico individual, el asesoramiento de riesgo o las decisiones de tratamiento.
Epidemiology
Desde la primera ola de estudios alrededor de 2005-2007, los GWAS se han aplicado a cientos de enfermedades y rasgos cuantitativos en cohortes que van desde miles hasta millones de participantes, y repositorios curados como el Catálogo GWAS del NHGRI-EBI ahora registran decenas de miles de asociaciones. Una limitación persistente es que la gran mayoría de los participantes han sido de ascendencia europea, lo que restringe la transferibilidad de los hallazgos y las puntuaciones poligénicas a otras poblaciones.
Evidence & guidelines
Los estándares metodológicos para los GWAS se consolidaron a través de grandes esfuerzos de consorcios y síntesis de revisiones, más que mediante guías de práctica clínica. El estudio del Wellcome Trust Case Control Consortium (2007) es una demostración canónica del diseño de control compartido y múltiples enfermedades, y los artículos de revisión de McCarthy et al. (2008) y Visscher et al. (2012, 2017) articulan las expectativas de consenso sobre umbrales de significación, control de calidad, replicación e interpretación.
History
El enfoque se hizo factible una vez que los mapas densos de SNP y el proyecto HapMap caracterizaron el desequilibrio de ligamiento a nivel de genoma completo, y una vez que aparecieron los arrays de genotipado asequibles a mediados de la década de 2000. El estudio del Wellcome Trust Case Control Consortium de 2007, que probó siete enfermedades comunes contra controles compartidos, demostró el diseño a gran escala y catalizó una rápida expansión del mapeo de asociaciones. Revisiones posteriores rastrearon la maduración del campo desde un puñado de loci hasta catálogos a nivel de genoma completo, y su confrontación con la heredabilidad perdida, la diversidad poblacional y el avance hacia estudios de secuenciación de variantes raras y de genoma completo.
Debates
- ¿Cuánto de la heredabilidad de los rasgos comunes pueden recuperar los GWAS?
- Los loci de los primeros GWAS explicaron solo una pequeña fracción de la heredabilidad estimada, lo que provocó un debate sobre si la brecha refleja muchas variantes comunes de pequeño efecto no detectadas, variantes raras, variación estructural o una heredabilidad sobreestimada; métodos posteriores de genoma completo redujeron, pero no cerraron, la brecha.
- ¿El sesgo de ascendencia europea de los GWAS limita la equidad y la validez?
- Dado que la mayoría de los participantes han sido de ascendencia europea, las asociaciones descubiertas y las puntuaciones poligénicas se transfieren imperfectamente a otras poblaciones, lo que plantea preocupaciones científicas sobre la generalizabilidad y preocupaciones de equidad sobre quién se beneficia de la medicina genómica.
Key figures
- Peter Visscher
- Mark McCarthy
- Joel Hirschhorn
- Naomi Wray
- Jian Yang
Related topics
Seminal works
- wtccc-2007
- mccarthy-2008
- visscher-2012
- visscher-2017
Frequently asked questions
- ¿Cuál es la diferencia entre un GWAS y un estudio de ligamiento?
- Los estudios de ligamiento siguen la co-segregación de marcadores y enfermedades dentro de las familias y localizan regiones cromosómicas amplias, mientras que un GWAS evalúa la asociación entre individuos no relacionados con una resolución fina a nivel de genoma completo, lo que lo hace más adecuado para variantes comunes de pequeño efecto.
- ¿Por qué los GWAS utilizan un umbral de significación tan estricto?
- Debido a que se prueban millones de variantes, un valor p convencional de 0.05 produciría un número enorme de falsos positivos; un umbral a nivel de genoma completo cercano a 5 x 10^-8 tiene en cuenta las pruebas múltiples implicadas por la variación común independiente en todo el genoma.