Phylogénétique moléculaire et analyse évolutive
La phylogénétique moléculaire reconstitue les relations évolutives entre les virus à partir de leurs séquences génétiques, les représentant sous forme d'arbre où les ramifications reflètent l'ascendance commune et la divergence. Appliquée aux séquences virales générées par les laboratoires de diagnostic et de surveillance, elle permet d'identifier les variants, de retracer les liens de parenté entre les virus et de soutenir les inférences concernant leur évolution et leur propagation.
Definition
La phylogénétique moléculaire est l'inférence des relations évolutives entre les virus à partir de séquences nucléotidiques ou d'acides aminés alignées, produisant des arbres dont la topologie et les longueurs de branches résument l'ascendance commune et la divergence génétique.
Scope
Ce sujet aborde les principes de construction et d'interprétation des arbres phylogénétiques à partir de séquences virales : l'alignement de séquences, les méthodes de construction d'arbres basées sur les distances et sur les caractères, le soutien statistique tel que le *bootstrap*, et l'utilisation des phylogénies pour caractériser les variants et les relations évolutives. Il s'agit d'une référence méthodologique et analytique qui ne fournit pas de protocoles ni de conseils de prise en charge clinique.
Core questions
- Comment les séquences virales alignées sont-elles transformées en un arbre de relations évolutives ?
- Que représentent l'ordre de ramification et la longueur des branches ?
- Comment la confiance dans la structure d'un arbre est-elle évaluée ?
- Comment les phylogénies peuvent-elles éclairer la compréhension des variants viraux, de leur diversité et de leur propagation ?
Key concepts
- Alignement de séquences
- Topologie de l'arbre phylogénétique et longueur des branches
- Méthodes basées sur les distances (par exemple, *neighbor-joining*)
- Maximum de vraisemblance et inférence bayésienne
- Modèles de substitution
- Soutien par *bootstrap*
- Horloge moléculaire
- Épidémiologie génomique et phylodynamique
Mechanisms
L'analyse phylogénétique débute par l'alignement de séquences virales homologues afin de comparer les positions correspondantes. À partir de l'alignement, les relations peuvent être inférées par des méthodes basées sur les distances, qui résument les différences par paires en un arbre (comme dans le *neighbor-joining*), ou par des méthodes basées sur les caractères, telles que le maximum de vraisemblance et l'inférence bayésienne, qui évaluent la capacité des arbres candidats à expliquer les séquences observées sous un modèle de substitution nucléotidique. La topologie de l'arbre résultant montre l'ascendance inférée et ses longueurs de branches reflètent le changement génétique estimé. La confiance dans les ramifications est généralement évaluée par le *bootstrap*, qui rééchantillonne les sites pour mesurer la cohérence de la récurrence d'un regroupement. Lorsque les dates d'échantillonnage sont incluses, les modèles d'horloge moléculaire relient la divergence génétique au temps, soutenant l'inférence phylodynamique concernant le rythme et les schémas de l'évolution et de la propagation virales.
Clinical relevance
L'analyse phylogénétique relie la détection en laboratoire à la caractérisation en plaçant les virus détectés dans leur contexte évolutif, aidant à définir les variants et à comprendre les liens de parenté entre les isolats. Cette entrée décrit les méthodes analytiques et ce que les arbres peuvent ou ne peuvent pas montrer ; elle est descriptive et ne constitue pas une base pour des décisions diagnostiques ou thérapeutiques individuelles.
Epidemiology
La surveillance génomique et phylogénétique est devenue un complément de routine au diagnostic moléculaire, utilisée pour suivre les variants émergents et reconstituer les schémas de transmission ; le séquençage à grande échelle pendant la pandémie de COVID-19 a fait du suivi phylogénétique en temps réel de l'évolution virale une activité de santé publique de premier plan.
History
La phylogénétique quantitative a mûri dans les années 1980, à mesure que les méthodes d'inférence et d'évaluation des arbres à partir de données moléculaires étaient formalisées : Felsenstein a introduit le *bootstrap* pour évaluer la confiance en 1985, et Saitou et Nei ont décrit l'algorithme de *neighbor-joining* largement utilisé en 1987. Des logiciels tels que le package MEGA, mis à jour jusqu'à la version 11 en 2021, ont rendu ces analyses largement accessibles et sont largement appliqués aux données de séquences virales.
Key figures
- Joseph Felsenstein
- Masatoshi Nei
- Naruya Saitou
Related topics
Seminal works
- felsenstein-1985
- saitou-nei-1987
- tamura-2021
Frequently asked questions
- Que montre un arbre phylogénétique de virus ?
- Il montre les relations évolutives inférées entre les séquences virales : l'ordre de ramification reflète l'ascendance commune et la divergence, et les longueurs de branches reflètent la quantité de changement génétique estimée. Il s'agit d'une hypothèse sur la parenté, et non d'une observation directe de l'histoire.
- Pourquoi le soutien par *bootstrap* est-il rapporté avec les arbres phylogénétiques ?
- Le *bootstrap* rééchantillonne les positions dans l'alignement pour tester la cohérence de l'apparition de chaque regroupement, fournissant une mesure de confiance dans les branches. Un faible soutien indique qu'une relation particulière dans l'arbre est incertaine.