Soutien et confiance des arbres phylogénétiques
Les mesures de soutien quantifient la force avec laquelle les données étayent les branches individuelles d'un arbre estimé, permettant ainsi de distinguer les parties robustes et faibles d'une phylogénie.
Definition
Le soutien d'un arbre est une estimation quantitative de la confiance accordée à un clade ou une branche donnée d'un arbre phylogénétique, dérivée du rééchantillonnage des données ou de la distribution a posteriori des arbres.
Scope
Ce sujet aborde le soutien basé sur le rééchantillonnage, tel que le bootstrap non paramétrique et le jackknife, le soutien par déclin (Bremer) sous parcimonie, les probabilités a posteriori bayésiennes, ainsi que l'interprétation et les biais connus de ces mesures, y compris la signification d'une valeur de soutien particulière.
Core questions
- Comment les méthodes de rééchantillonnage estiment-elles la confiance dans un clade ?
- Quelle est la différence entre les valeurs de bootstrap et les probabilités a posteriori bayésiennes ?
- Comment une valeur de soutien donnée doit-elle être interprétée ?
- Quels biais affectent les mesures de soutien ?
Key theories
- Bootstrap non paramétrique
- Les caractères sont rééchantillonnés avec remplacement pour construire des jeux de données pseudo-répliqués, et la fréquence à laquelle un clade réapparaît à travers les réplicats est rapportée comme son soutien bootstrap.
- Interprétation des valeurs de bootstrap
- Des études empiriques et de simulation montrent que les proportions de bootstrap sont des estimations conservatrices de la fiabilité dans des conditions réalistes, ce qui étaye la convention selon laquelle des valeurs élevées indiquent des clades bien soutenus.
Clinical relevance
Les valeurs de soutien indiquent aux chercheurs quelles relations inférées sont suffisamment fiables pour être utilisées, constituant une garantie essentielle lorsque les phylogénies guident l'attribution des épidémies, la traçabilité des sources ou les décisions de conservation.
History
L'adaptation du bootstrap aux phylogénies par Felsenstein en 1985 a introduit une mesure de confiance pratique qui est devenue quasi universelle ; des tests empiriques ultérieurs et l'essor des probabilités a posteriori bayésiennes ont affiné la manière dont les systématiciens rapportent et interprètent le soutien des branches.
Debates
- Bootstrap versus probabilités a posteriori bayésiennes
- Les probabilités a posteriori bayésiennes sont souvent plus élevées que les valeurs de bootstrap pour les mêmes données, et il existe une discussion continue sur laquelle est la mieux calibrée et comment chacune devrait être interprétée.
Key figures
- Joseph Felsenstein
- David Hillis
- James Bull
Related topics
Seminal works
- felsenstein1985
- hillis1993
- felsenstein2004
Frequently asked questions
- Que signifie une valeur de bootstrap de 95 pour cent ?
- Cela signifie que le clade est apparu dans 95 pour cent des analyses pseudo-répliquées rééchantillonnées ; des valeurs élevées indiquent que le résultat est robuste au rééchantillonnage des caractères, bien qu'elles ne soient pas des probabilités statistiques exactes.
- Pourquoi les probabilités a posteriori bayésiennes diffèrent-elles des valeurs de bootstrap ?
- Elles sont calculées différemment, les probabilités a posteriori reflétant la proportion d'arbres échantillonnés contenant un clade ; pour les mêmes données, elles sont fréquemment plus élevées que le soutien bootstrap correspondant.