Inferencia Filogenética
La inferencia filogenética es el conjunto de métodos utilizados para reconstruir árboles evolutivos a partir de datos de caracteres, transformando patrones de similitud y diferencia en hipótesis sobre la ascendencia.
Definition
La inferencia filogenética es la estimación de las relaciones evolutivas entre taxones a partir de caracteres heredables, con mayor frecuencia secuencias moleculares. Produce un árbol, con un orden de ramificación y a veces longitudes de rama, que mejor explica los datos bajo un criterio de optimización explícito o un modelo probabilístico.
Scope
Este tema abarca los principales métodos de construcción de árboles: distancia, parsimonia, máxima verosimilitud e inferencia bayesiana; los modelos de evolución de secuencias que asumen; el uso del bootstrap y las probabilidades posteriores para evaluar el soporte; y las trampas, como la atracción de ramas largas, que pueden inducir a error en la inferencia.
Core questions
- ¿Cómo difieren los métodos de distancia, parsimonia, verosimilitud y bayesianos en la inferencia de árboles?
- ¿Qué modelos describen cómo cambian las secuencias de ADN a lo largo de las ramas?
- ¿Cómo se evalúa la confianza en un árbol, como el soporte bootstrap o la probabilidad posterior?
- ¿Qué artefactos, como la atracción de ramas largas, pueden causar árboles incorrectos?
Key theories
- Inferencia de árboles basada en la optimización y basada en modelos
- Los árboles se pueden elegir minimizando los cambios de caracteres (parsimonia), ajustando las distancias por pares (métodos de distancia) o maximizando la probabilidad de los datos bajo un modelo de sustitución explícito (métodos de verosimilitud y bayesianos).
- Evaluación del soporte mediante bootstrap
- El remuestreo de caracteres con reemplazo y la reconstrucción de árboles estiman la fuerza con la que los datos apoyan cada clado, proporcionando una medida estándar de confianza en las relaciones inferidas.
Mechanisms
Los métodos de distancia, como el neighbor-joining, convierten las diferencias de secuencia en una matriz y construyen un árbol mediante agrupamiento, ofreciendo velocidad con cierta pérdida de información. La parsimonia selecciona el árbol que requiere el menor número de cambios de caracteres. Los métodos de máxima verosimilitud y bayesianos adoptan modelos explícitos de sustitución, teniendo en cuenta las frecuencias desiguales de bases, el sesgo de transición-transversión y la variación de la tasa entre sitios, y buscan el árbol (y los parámetros) que mejor explican los datos. El soporte se evalúa mediante el bootstrap para la verosimilitud y la parsimonia, o mediante probabilidades posteriores en el análisis bayesiano. La atracción de ramas largas y la especificación incorrecta del modelo pueden producir árboles erróneos con alta confianza, por lo que la elección del método y la adecuación del modelo son importantes.
Clinical relevance
La inferencia filogenética reconstruye las historias de transmisión viral y bacteriana, identifica el origen de los brotes y data la aparición de cepas resistentes o virulentas, lo que la convierte en una herramienta central de la epidemiología genómica.
History
Los métodos cladísticos y de distancia surgieron en las décadas de 1960 y 1970; Saitou y Nei introdujeron el neighbor-joining en 1987, y Felsenstein fue pionero en la máxima verosimilitud para secuencias y, en 1985, en el bootstrap para filogenias. Desde entonces, la inferencia bayesiana y los conjuntos de datos genómicos cada vez más grandes se han convertido en estándar.
Debates
- Parsimonia versus métodos basados en modelos
- Un debate metodológico de larga data se refiere a si la parsimonia o los modelos probabilísticos explícitos producen árboles más confiables, especialmente cuando las tasas de cambio son desiguales y la atracción de ramas largas es un riesgo.
Key figures
- Joseph Felsenstein
- Masatoshi Nei
- Naruya Saitou
- Willi Hennig
Related topics
Seminal works
- saitouNei1987
- felsenstein1985
- felsensteinBook2004
Frequently asked questions
- ¿Qué método proporciona el árbol evolutivo correcto?
- Ningún método garantiza ser correcto; los métodos basados en modelos, como la máxima verosimilitud y la inferencia bayesiana, suelen ser preferidos para los datos de secuencia, pero todos los métodos pueden ser engañados por tasas evolutivas desiguales y violaciones del modelo, por lo que las medidas de soporte son esenciales.
- ¿Qué significa un valor de bootstrap?
- Un valor de bootstrap refleja la frecuencia con la que un agrupamiento particular se repite cuando los datos se remuestrean y el árbol se reconstruye; los valores altos indican que el agrupamiento está fuertemente respaldado por los caracteres analizados.