ScholarGate
Asistente

Métodos de Inferencia de Mezcla Genética y Ascendencia

Los métodos de inferencia de mezcla genética y ascendencia estiman, a partir de los genotipos de un individuo, las proporciones de su genoma derivadas de diferentes poblaciones ancestrales de origen, y evalúan si las poblaciones han intercambiado genes en el pasado. Convierten los patrones de compartición de alelos en afirmaciones cuantitativas sobre la ascendencia y la mezcla poblacional.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

La inferencia de ascendencia es la estimación de la(s) fuente(s) ancestral(es) del genoma de un individuo a partir de datos genéticos; la inferencia de mezcla genética estima específicamente las proporciones aportadas por poblaciones ancestrales distintas y evalúa el flujo génico histórico entre ellas.

Scope

Esta entrada abarca el agrupamiento basado en modelos y la estimación de la proporción de ascendencia, los enfoques de reducción de dimensionalidad y las pruebas formales de mezcla genética, junto con los supuestos en los que se basan estos métodos. Es un tema metodológico; describe la inferencia estadística de la ascendencia genética y no hace afirmaciones clínicas o sociales sobre las categorías de ascendencia.

Core questions

  • ¿Cómo se estiman las proporciones de ascendencia a partir de datos de genotipos?
  • ¿En qué se diferencian los enfoques de agrupamiento basado en modelos y de componentes principales?
  • ¿Cómo se evalúa formalmente el flujo génico pasado entre poblaciones?
  • ¿Qué supuestos y limitaciones afectan las estimaciones de ascendencia?

Key concepts

  • Proporciones de ascendencia
  • Agrupamiento basado en modelos (STRUCTURE/ADMIXTURE)
  • Número de poblaciones de origen (K)
  • Análisis de componentes principales
  • f-estadísticos y pruebas de mezcla genética
  • Paneles de referencia para ascendencia

Key theories

Mezcla de ascendencia basada en modelos
El genoma de cada individuo se modela como una mezcla derivada de K poblaciones ancestrales con frecuencias alélicas distintas; los métodos basados en máxima verosimilitud o bayesianos estiman conjuntamente las frecuencias alélicas ancestrales y las proporciones de ascendencia de cada individuo, proporcionando una descomposición probabilística de la estructura.

Mechanisms

Los métodos basados en modelos tratan cada genoma como una mezcla de K poblaciones ancestrales y estiman, mediante inferencia de máxima verosimilitud o bayesiana, tanto las frecuencias alélicas ancestrales como las proporciones de mezcla de cada individuo; una implementación eficiente de máxima verosimilitud hizo esto factible a escala genómica. Enfoques complementarios utilizan el análisis de componentes principales para ubicar a los individuos en un espacio de ascendencia de baja dimensionalidad sin especificar poblaciones de antemano. Las pruebas formales de mezcla genética basadas en f-estadísticos comparan patrones de compartición de alelos entre poblaciones para detectar y cuantificar el flujo génico histórico. Todos estos dependen de poblaciones de referencia apropiadas y de la elección del número de poblaciones de origen.

Clinical relevance

La inferencia de ascendencia apoya el manejo correcto de la estructura poblacional en estudios genéticos y el uso apropiado de datos de referencia emparejados por ascendencia al interpretar resultados genómicos. Esta entrada describe los métodos estadísticos utilizados para estimar la ascendencia genética y no es una base para decisiones diagnósticas o de tratamiento individuales, ni para equiparar la ascendencia genética con la identidad social.

Evidence & guidelines

La estimación de ascendencia basada en modelos fue establecida por el marco STRUCTURE y se hizo escalable mediante implementaciones de máxima verosimilitud, mientras que los métodos de componentes principales y las pruebas de mezcla genética basadas en f-estadísticos proporcionan enfoques complementarios y ampliamente utilizados; los estudios a escala genómica de la variación humana mundial demuestran su aplicación en diversas poblaciones.

History

El agrupamiento basado en modelos de genotipos multilocus se introdujo alrededor del año 2000 y rápidamente se convirtió en un estándar para describir la estructura poblacional; implementaciones más rápidas de máxima verosimilitud surgieron a medida que crecían los datos a escala genómica. Los métodos de componentes principales se adaptaron a la inferencia de ascendencia a mediados de la década de 2000, y los marcos de f-estadísticos formalizaron pruebas para la mezcla genética antigua, convirtiendo así la inferencia de ascendencia y mezcla genética en herramientas centrales de la genómica poblacional.

Debates

¿Cómo se debe elegir e interpretar el número de poblaciones de origen (K)?
Los métodos basados en modelos requieren especificar o seleccionar K, pero los clústeres inferidos son constructos estadísticos cuya interpretación depende del muestreo y de K; tratarlos como poblaciones naturales y discretas puede ser engañoso.

Key figures

  • Jonathan Pritchard
  • John Novembre
  • David Reich
  • Nick Patterson

Related topics

Seminal works

  • pritchard-2000
  • alexander-2009
  • patterson-2012

Frequently asked questions

¿Qué significa, por ejemplo, una proporción de ascendencia del 30% de una población?
Es una estimación basada en modelos que indica que aproximadamente el 30% del genoma del individuo se explica mejor por las frecuencias alélicas de esa fuente ancestral inferida; es una descomposición estadística relativa a las poblaciones de referencia elegidas, no una etiqueta biológica fija.
¿Cómo se detecta la mezcla genética entre poblaciones?
Las pruebas formales basadas en f-estadísticos comparan patrones de variación compartida entre varias poblaciones; las desviaciones de lo que se esperaría sin flujo génico proporcionan evidencia de que ocurrió mezcla genética.

Methods for this concept

Related concepts