¿Qué significa, por ejemplo, una proporción de ascendencia del 30% de una población?

Es una estimación basada en modelos que indica que aproximadamente el 30% del genoma del individuo se explica mejor por las frecuencias alélicas de esa fuente ancestral inferida; es una descomposición estadística relativa a las poblaciones de referencia elegidas, no una etiqueta biológica fija.

¿Cómo se detecta la mezcla genética entre poblaciones?

Las pruebas formales basadas en f-estadísticos comparan patrones de variación compartida entre varias poblaciones; las desviaciones de lo que se esperaría sin flujo génico proporcionan evidencia de que ocurrió mezcla genética.

Métodos de Inferencia de Mezcla Genética y Ascendencia

Los métodos de inferencia de mezcla genética y ascendencia estiman, a partir de los genotipos de un individuo, las proporciones de su genoma derivadas de diferentes poblaciones ancestrales de origen, y evalúan si las poblaciones han intercambiado genes en el pasado. Convierten los patrones de compartición de alelos en afirmaciones cuantitativas sobre la ascendencia y la mezcla poblacional.

Encontrar tema con PaperMindPróximamenteFind papers & topics

Tools & resources

Descargar diapositivas

Learn & explore

VídeoPróximamente

Definition

La inferencia de ascendencia es la estimación de la(s) fuente(s) ancestral(es) del genoma de un individuo a partir de datos genéticos; la inferencia de mezcla genética estima específicamente las proporciones aportadas por poblaciones ancestrales distintas y evalúa el flujo génico histórico entre ellas.

Scope

Esta entrada abarca el agrupamiento basado en modelos y la estimación de la proporción de ascendencia, los enfoques de reducción de dimensionalidad y las pruebas formales de mezcla genética, junto con los supuestos en los que se basan estos métodos. Es un tema metodológico; describe la inferencia estadística de la ascendencia genética y no hace afirmaciones clínicas o sociales sobre las categorías de ascendencia.

Core questions

¿Cómo se estiman las proporciones de ascendencia a partir de datos de genotipos?
¿En qué se diferencian los enfoques de agrupamiento basado en modelos y de componentes principales?
¿Cómo se evalúa formalmente el flujo génico pasado entre poblaciones?
¿Qué supuestos y limitaciones afectan las estimaciones de ascendencia?

Key concepts

Proporciones de ascendencia
Agrupamiento basado en modelos (STRUCTURE/ADMIXTURE)
Número de poblaciones de origen (K)
Análisis de componentes principales
f-estadísticos y pruebas de mezcla genética
Paneles de referencia para ascendencia

Key theories

Mezcla de ascendencia basada en modelos: El genoma de cada individuo se modela como una mezcla derivada de K poblaciones ancestrales con frecuencias alélicas distintas; los métodos basados en máxima verosimilitud o bayesianos estiman conjuntamente las frecuencias alélicas ancestrales y las proporciones de ascendencia de cada individuo, proporcionando una descomposición probabilística de la estructura.

Mechanisms

Los métodos basados en modelos tratan cada genoma como una mezcla de K poblaciones ancestrales y estiman, mediante inferencia de máxima verosimilitud o bayesiana, tanto las frecuencias alélicas ancestrales como las proporciones de mezcla de cada individuo; una implementación eficiente de máxima verosimilitud hizo esto factible a escala genómica. Enfoques complementarios utilizan el análisis de componentes principales para ubicar a los individuos en un espacio de ascendencia de baja dimensionalidad sin especificar poblaciones de antemano. Las pruebas formales de mezcla genética basadas en f-estadísticos comparan patrones de compartición de alelos entre poblaciones para detectar y cuantificar el flujo génico histórico. Todos estos dependen de poblaciones de referencia apropiadas y de la elección del número de poblaciones de origen.

Clinical relevance

La inferencia de ascendencia apoya el manejo correcto de la estructura poblacional en estudios genéticos y el uso apropiado de datos de referencia emparejados por ascendencia al interpretar resultados genómicos. Esta entrada describe los métodos estadísticos utilizados para estimar la ascendencia genética y no es una base para decisiones diagnósticas o de tratamiento individuales, ni para equiparar la ascendencia genética con la identidad social.

Evidence & guidelines

La estimación de ascendencia basada en modelos fue establecida por el marco STRUCTURE y se hizo escalable mediante implementaciones de máxima verosimilitud, mientras que los métodos de componentes principales y las pruebas de mezcla genética basadas en f-estadísticos proporcionan enfoques complementarios y ampliamente utilizados; los estudios a escala genómica de la variación humana mundial demuestran su aplicación en diversas poblaciones.

History

El agrupamiento basado en modelos de genotipos multilocus se introdujo alrededor del año 2000 y rápidamente se convirtió en un estándar para describir la estructura poblacional; implementaciones más rápidas de máxima verosimilitud surgieron a medida que crecían los datos a escala genómica. Los métodos de componentes principales se adaptaron a la inferencia de ascendencia a mediados de la década de 2000, y los marcos de f-estadísticos formalizaron pruebas para la mezcla genética antigua, convirtiendo así la inferencia de ascendencia y mezcla genética en herramientas centrales de la genómica poblacional.

Debates

¿Cómo se debe elegir e interpretar el número de poblaciones de origen (K)?: Los métodos basados en modelos requieren especificar o seleccionar K, pero los clústeres inferidos son constructos estadísticos cuya interpretación depende del muestreo y de K; tratarlos como poblaciones naturales y discretas puede ser engañoso.

Key figures

Jonathan Pritchard
John Novembre
David Reich
Nick Patterson

Seminal works

pritchard-2000
alexander-2009
patterson-2012

Frequently asked questions

¿Qué significa, por ejemplo, una proporción de ascendencia del 30% de una población?: Es una estimación basada en modelos que indica que aproximadamente el 30% del genoma del individuo se explica mejor por las frecuencias alélicas de esa fuente ancestral inferida; es una descomposición estadística relativa a las poblaciones de referencia elegidas, no una etiqueta biológica fija.
¿Cómo se detecta la mezcla genética entre poblaciones?: Las pruebas formales basadas en f-estadísticos comparan patrones de variación compartida entre varias poblaciones; las desviaciones de lo que se esperaría sin flujo génico proporcionan evidencia de que ocurrió mezcla genética.