ScholarGate
Asistente

Estratificación poblacional y ascendencia en GWAS

La estratificación poblacional es la diferencia sistemática en la ascendencia entre las personas comparadas en un estudio genético. Cuando los casos y los controles difieren en su origen ancestral, cualquier variante cuya frecuencia difiera entre esas ascendencias parecerá asociada con el rasgo, incluso si no tiene un papel causal, un factor de confusión que puede generar falsos positivos en todo el genoma. Detectar y ajustar la ascendencia es, por lo tanto, una salvaguarda fundamental para la validez de las pruebas de asociación.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

La estratificación poblacional es la confusión de la asociación genotipo-fenotipo por diferencias sistemáticas de ascendencia entre los grupos comparados, y su control es el conjunto de métodos —principalmente componentes principales de ascendencia y modelos mixtos— que ajustan las pruebas de asociación para que las señales reflejen los efectos dentro de la ascendencia en lugar de la ascendencia misma.

Scope

Este tema cubre por qué las diferencias de ascendencia confunden las pruebas de asociación, cómo se detecta la estratificación (inflación genómica, análisis de componentes principales), cómo se corrige (covariables de componentes principales, modelos mixtos, control genómico) y la preocupación más amplia de equidad de que el sesgo de ascendencia europea de los GWAS limita la transferibilidad de los hallazgos y las puntuaciones poligénicas. Es una referencia de métodos, no una guía clínica.

Core questions

  • ¿Cómo crean las diferencias de ascendencia entre casos y controles asociaciones espurias?
  • ¿Cómo se detecta la estratificación y qué indica un factor de control genómico inflado?
  • ¿Cómo corrige el análisis de componentes principales la ascendencia?
  • ¿Cuándo se prefieren los modelos mixtos para manejar la estructura y el parentesco?
  • ¿Por qué el sesgo de ascendencia europea de los GWAS limita la generalizabilidad?

Key concepts

  • Confusión por ascendencia
  • Control genómico y el factor de inflación (lambda)
  • Análisis de componentes principales de genotipos
  • Marcadores informativos de ascendencia
  • Modelos lineales mixtos para estructura y parentesco
  • Mezcla y ascendencia continua
  • Transferibilidad de hallazgos y puntuaciones poligénicas entre ascendencias

Mechanisms

Si los subgrupos de ascendencia diferente están representados de manera desigual entre los casos y los controles, y si tanto el riesgo de enfermedad como las frecuencias alélicas difieren entre esos subgrupos, la frecuencia alélica seguirá el rasgo a través de la ascendencia en lugar de la causalidad, inflando las estadísticas de prueba en todo el genoma. La detección se basa en esta firma genómica: el factor de inflación de control genómico resume cuánto excede la estadística de prueba mediana su expectativa nula, y el análisis de componentes principales de los genotipos de todo el genoma revela ejes de variación de la ascendencia entre las muestras. La corrección típicamente incluye los componentes principales principales como covariables en la regresión, lo que absorbe la señal de ascendencia, o utiliza modelos lineales mixtos que tienen en cuenta conjuntamente la estructura y el parentesco críptico a través de una matriz de relación genética. Los paneles de referencia como el Proyecto 1000 Genomas ayudan a ubicar las muestras en un mapa de ascendencia global e informan la imputación. Debido a que la mayoría de las muestras de GWAS son de ascendencia europea, incluso los análisis bien corregidos producen estimaciones de efectos y puntuaciones poligénicas que se transfieren imperfectamente a otras poblaciones.

Clinical relevance

El ajuste por ascendencia es esencial para la validez de la evidencia genética utilizada en la investigación de enfermedades, y la composición ancestral de los estudios incide directamente en la biología de quién está representada en los hallazgos y puntuaciones genómicas. Este tema describe los métodos y las consideraciones de equidad; no es una base para pruebas genéticas individuales o interpretación clínica.

Evidence & guidelines

Los estándares aquí provienen de la literatura metodológica en lugar de las guías clínicas. Price et al. (2006) introdujeron la corrección de componentes principales (el enfoque EIGENSTRAT) como una solución escalable; Price et al. (2010) revisaron y extendieron estrategias que incluyen modelos mixtos; el Proyecto 1000 Genomas (2015) proporcionó la referencia diversa necesaria para caracterizar la ascendencia; y Visscher et al. (2017) destacan las consecuencias de generalizabilidad y equidad del desequilibrio de ascendencia.

History

La preocupación de que la ascendencia pudiera confundir la asociación genética es anterior a los GWAS, y se desarrollaron enfoques tempranos como el control genómico y la asociación estructurada para abordarla. La introducción en 2006 del análisis de componentes principales proporcionó una forma rápida y genómica de modelar la ascendencia continua y se convirtió en una práctica estándar, complementada posteriormente por métodos de modelos mixtos que también manejan el parentesco. A medida que los GWAS se expandieron a los biobancos, el campo reconoció cada vez más que controlar la estratificación dentro de muestras predominantemente europeas no resuelve el problema mayor de la subrepresentación de otras ascendencias.

Debates

¿Las correcciones de ascendencia eliminan completamente la confusión, o también pueden eliminar la señal real?
Los componentes principales y los modelos mixtos controlan la estratificación de manera efectiva en la mayoría de los entornos, pero distinguir la confusión de la biología genuinamente correlacionada con la ascendencia, y evitar la sobrecorrección que borra los efectos reales, sigue siendo un juicio metodológico, especialmente para rasgos con una estructura geográfica sutil.
¿El sesgo de ascendencia europea de los GWAS socava la equidad y la validez?
Los hallazgos y las puntuaciones poligénicas derivados principalmente de muestras de ascendencia europea se transfieren imperfectamente a otras poblaciones, lo que plantea preocupaciones científicas sobre la generalizabilidad y preocupaciones de equidad sobre la distribución de los beneficios de la medicina genómica.

Key figures

  • Alkes Price
  • David Reich
  • Nick Patterson
  • Noah Zaitlen
  • Peter Visscher

Related topics

Seminal works

  • price-2006
  • price-2010

Frequently asked questions

¿Cómo crea la estratificación poblacional resultados falsos en los GWAS?
Si los casos y los controles difieren en ascendencia, las variantes cuya frecuencia difiere entre esas ascendencias parecen asociadas con el rasgo a través de la ascendencia en lugar de la causalidad, produciendo asociaciones espurias en todo el genoma.
¿Cómo se corrige habitualmente la estratificación?
El enfoque estándar incluye los componentes principales principales de los genotipos de todo el genoma como covariables, o utiliza un modelo lineal mixto, de modo que las pruebas de asociación reflejan los efectos dentro de la ascendencia en lugar de las diferencias de ascendencia en sí mismas.

Methods for this concept

Related concepts