ScholarGate
Assistant

Inférence phylogénétique

L'inférence phylogénétique est l'ensemble des méthodes utilisées pour reconstruire les arbres évolutifs à partir de données de caractères, transformant les schémas de similarité et de différence en hypothèses sur l'ascendance.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

L'inférence phylogénétique est l'estimation des relations évolutives entre taxons à partir de caractères héréditaires, le plus souvent des séquences moléculaires. Elle produit un arbre, avec un ordre de ramification et parfois des longueurs de branches, qui explique le mieux les données selon un critère d'optimalité explicite ou un modèle probabiliste.

Scope

Ce sujet couvre les principales méthodes de construction d'arbres, notamment les méthodes de distance, de parcimonie, du maximum de vraisemblance et d'inférence bayésienne, les modèles d'évolution des séquences qu'elles supposent, l'utilisation du bootstrap et des probabilités a posteriori pour évaluer le soutien, ainsi que les pièges tels que l'attraction des longues branches qui peuvent induire l'inférence en erreur.

Core questions

  • En quoi les méthodes de distance, de parcimonie, de vraisemblance et bayésiennes diffèrent-elles dans l'inférence des arbres ?
  • Quels modèles décrivent la façon dont les séquences d'ADN changent le long des branches ?
  • Comment la confiance dans un arbre, telle que le soutien par bootstrap ou la probabilité a posteriori, est-elle évaluée ?
  • Quels artefacts, comme l'attraction des longues branches, peuvent entraîner des arbres incorrects ?

Key theories

Inférence d'arbres basée sur l'optimalité et basée sur des modèles
Les arbres peuvent être choisis en minimisant les changements de caractères (parcimonie), en ajustant les distances par paires (méthodes de distance), ou en maximisant la probabilité des données sous un modèle de substitution explicite (méthodes de vraisemblance et bayésiennes).
Évaluation du soutien par bootstrap
Le rééchantillonnage des caractères avec remplacement et la reconstruction des arbres estiment la force avec laquelle les données soutiennent chaque clade, fournissant une mesure standard de confiance dans les relations inférées.

Mechanisms

Les méthodes de distance, telles que le neighbor-joining, convertissent les différences de séquence en une matrice et construisent un arbre par regroupement, offrant une rapidité au prix d'une certaine perte d'information. La parcimonie sélectionne l'arbre nécessitant le moins de changements de caractères. Les méthodes du maximum de vraisemblance et bayésiennes adoptent des modèles de substitution explicites, tenant compte des fréquences de bases inégales, du biais de transition-transversion et de la variation des taux entre sites, et recherchent l'arbre (et les paramètres) qui expliquent le mieux les données. Le soutien est évalué par le bootstrap pour la vraisemblance et la parcimonie, ou par les probabilités a posteriori dans l'analyse bayésienne. L'attraction des longues branches et la mauvaise spécification du modèle peuvent produire des arbres erronés avec une grande confiance, de sorte que le choix de la méthode et l'adéquation du modèle sont importants.

Clinical relevance

L'inférence phylogénétique reconstitue les historiques de transmission virale et bactérienne, identifie la source des épidémies et date l'émergence de souches résistantes ou virulentes, ce qui en fait un outil essentiel de l'épidémiologie génomique.

History

Les méthodes cladistiques et de distance sont apparues dans les années 1960-1970 ; Saitou et Nei ont introduit le neighbor-joining en 1987, et Felsenstein a été le pionnier du maximum de vraisemblance pour les séquences et, en 1985, du bootstrap pour les phylogénies. L'inférence bayésienne et des ensembles de données génomiques toujours plus grands sont depuis devenus la norme.

Debates

Parcimonie versus méthodes basées sur des modèles
Un débat méthodologique de longue date porte sur la question de savoir si la parcimonie ou les modèles probabilistes explicites donnent des arbres plus fiables, en particulier lorsque les taux de changement sont inégaux et que l'attraction des longues branches présente un risque.

Key figures

  • Joseph Felsenstein
  • Masatoshi Nei
  • Naruya Saitou
  • Willi Hennig

Related topics

Seminal works

  • saitouNei1987
  • felsenstein1985
  • felsensteinBook2004

Frequently asked questions

Quelle méthode donne l'arbre évolutif correct ?
Aucune méthode n'est garantie correcte ; les méthodes basées sur des modèles, comme le maximum de vraisemblance et l'inférence bayésienne, sont généralement privilégiées pour les données de séquence, mais toutes les méthodes peuvent être induites en erreur par des taux évolutifs inégaux et des violations de modèle, de sorte que les mesures de soutien sont essentielles.
Que signifie une valeur de bootstrap ?
Une valeur de bootstrap reflète la fréquence à laquelle un regroupement particulier réapparaît lorsque les données sont rééchantillonnées et l'arbre reconstruit ; des valeurs élevées indiquent que le regroupement est fortement soutenu par les caractères analysés.

Methods for this concept

Related concepts