Métodos de Inferencia de Mezcla Genética y Ascendencia
Los métodos de inferencia de mezcla genética y ascendencia estiman, a partir de los genotipos de un individuo, las proporciones de su genoma derivadas de diferentes poblaciones ancestrales de origen, y evalúan si las poblaciones han intercambiado genes en el pasado. Convierten los patrones de compartición de alelos en afirmaciones cuantitativas sobre la ascendencia y la mezcla poblacional.
Definition
La inferencia de ascendencia es la estimación de la(s) fuente(s) ancestral(es) del genoma de un individuo a partir de datos genéticos; la inferencia de mezcla genética estima específicamente las proporciones aportadas por poblaciones ancestrales distintas y evalúa el flujo génico histórico entre ellas.
Scope
Esta entrada abarca el agrupamiento basado en modelos y la estimación de la proporción de ascendencia, los enfoques de reducción de dimensionalidad y las pruebas formales de mezcla genética, junto con los supuestos en los que se basan estos métodos. Es un tema metodológico; describe la inferencia estadística de la ascendencia genética y no hace afirmaciones clínicas o sociales sobre las categorías de ascendencia.
Core questions
- ¿Cómo se estiman las proporciones de ascendencia a partir de datos de genotipos?
- ¿En qué se diferencian los enfoques de agrupamiento basado en modelos y de componentes principales?
- ¿Cómo se evalúa formalmente el flujo génico pasado entre poblaciones?
- ¿Qué supuestos y limitaciones afectan las estimaciones de ascendencia?
Key concepts
- Proporciones de ascendencia
- Agrupamiento basado en modelos (STRUCTURE/ADMIXTURE)
- Número de poblaciones de origen (K)
- Análisis de componentes principales
- f-estadísticos y pruebas de mezcla genética
- Paneles de referencia para ascendencia
Key theories
- Mezcla de ascendencia basada en modelos
- El genoma de cada individuo se modela como una mezcla derivada de K poblaciones ancestrales con frecuencias alélicas distintas; los métodos basados en máxima verosimilitud o bayesianos estiman conjuntamente las frecuencias alélicas ancestrales y las proporciones de ascendencia de cada individuo, proporcionando una descomposición probabilística de la estructura.
Mechanisms
Los métodos basados en modelos tratan cada genoma como una mezcla de K poblaciones ancestrales y estiman, mediante inferencia de máxima verosimilitud o bayesiana, tanto las frecuencias alélicas ancestrales como las proporciones de mezcla de cada individuo; una implementación eficiente de máxima verosimilitud hizo esto factible a escala genómica. Enfoques complementarios utilizan el análisis de componentes principales para ubicar a los individuos en un espacio de ascendencia de baja dimensionalidad sin especificar poblaciones de antemano. Las pruebas formales de mezcla genética basadas en f-estadísticos comparan patrones de compartición de alelos entre poblaciones para detectar y cuantificar el flujo génico histórico. Todos estos dependen de poblaciones de referencia apropiadas y de la elección del número de poblaciones de origen.
Clinical relevance
La inferencia de ascendencia apoya el manejo correcto de la estructura poblacional en estudios genéticos y el uso apropiado de datos de referencia emparejados por ascendencia al interpretar resultados genómicos. Esta entrada describe los métodos estadísticos utilizados para estimar la ascendencia genética y no es una base para decisiones diagnósticas o de tratamiento individuales, ni para equiparar la ascendencia genética con la identidad social.
Evidence & guidelines
La estimación de ascendencia basada en modelos fue establecida por el marco STRUCTURE y se hizo escalable mediante implementaciones de máxima verosimilitud, mientras que los métodos de componentes principales y las pruebas de mezcla genética basadas en f-estadísticos proporcionan enfoques complementarios y ampliamente utilizados; los estudios a escala genómica de la variación humana mundial demuestran su aplicación en diversas poblaciones.
History
El agrupamiento basado en modelos de genotipos multilocus se introdujo alrededor del año 2000 y rápidamente se convirtió en un estándar para describir la estructura poblacional; implementaciones más rápidas de máxima verosimilitud surgieron a medida que crecían los datos a escala genómica. Los métodos de componentes principales se adaptaron a la inferencia de ascendencia a mediados de la década de 2000, y los marcos de f-estadísticos formalizaron pruebas para la mezcla genética antigua, convirtiendo así la inferencia de ascendencia y mezcla genética en herramientas centrales de la genómica poblacional.
Debates
- ¿Cómo se debe elegir e interpretar el número de poblaciones de origen (K)?
- Los métodos basados en modelos requieren especificar o seleccionar K, pero los clústeres inferidos son constructos estadísticos cuya interpretación depende del muestreo y de K; tratarlos como poblaciones naturales y discretas puede ser engañoso.
Key figures
- Jonathan Pritchard
- John Novembre
- David Reich
- Nick Patterson
Related topics
Seminal works
- pritchard-2000
- alexander-2009
- patterson-2012
Frequently asked questions
- ¿Qué significa, por ejemplo, una proporción de ascendencia del 30% de una población?
- Es una estimación basada en modelos que indica que aproximadamente el 30% del genoma del individuo se explica mejor por las frecuencias alélicas de esa fuente ancestral inferida; es una descomposición estadística relativa a las poblaciones de referencia elegidas, no una etiqueta biológica fija.
- ¿Cómo se detecta la mezcla genética entre poblaciones?
- Las pruebas formales basadas en f-estadísticos comparan patrones de variación compartida entre varias poblaciones; las desviaciones de lo que se esperaría sin flujo génico proporcionan evidencia de que ocurrió mezcla genética.