ScholarGate
Assistent

Phylogenetische Inferenz

Phylogenetische Inferenz ist die Gesamtheit der Methoden, die verwendet werden, um Evolutionsbäume aus Merkmalsdaten zu rekonstruieren und Muster von Ähnlichkeit und Unterschied in Hypothesen über die Abstammung umzuwandeln.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Phylogenetische Inferenz ist die Schätzung evolutionärer Beziehungen zwischen Taxa aus vererbbaren Merkmalen, meist molekularen Sequenzen. Sie erzeugt einen Baum mit Verzweigungsreihenfolge und manchmal Astlängen, der die Daten unter einem expliziten Optimalitätskriterium oder probabilistischen Modell am besten erklärt.

Scope

Dieses Thema behandelt die wichtigsten Methoden zur Baumkonstruktion – Distanz, Parsimonie, Maximum Likelihood und Bayessche Inferenz –, die Modelle der Sequenzentwicklung, die sie annehmen, die Verwendung von Bootstrap und posterioren Wahrscheinlichkeiten zur Bewertung der Unterstützung sowie Fallstricke wie die Long-Branch Attraction, die die Inferenz irreführen können.

Core questions

  • Wie unterscheiden sich Distanz-, Parsimonie-, Likelihood- und Bayessche Methoden bei der Inferenz von Bäumen?
  • Welche Modelle beschreiben, wie sich DNA-Sequenzen entlang von Ästen ändern?
  • Wie wird die Konfidenz in einen Baum, wie z. B. Bootstrap-Unterstützung oder posteriore Wahrscheinlichkeit, bewertet?
  • Welche Artefakte, wie die Long-Branch Attraction, können zu inkorrekten Bäumen führen?

Key theories

Optimalitätsbasierte und modellbasierte Bauminferenz
Bäume können durch Minimierung von Merkmalsänderungen (Parsimonie), Anpassung paarweiser Distanzen (Distanzmethoden) oder Maximierung der Wahrscheinlichkeit der Daten unter einem expliziten Substitutionsmodell (Likelihood- und Bayessche Methoden) ausgewählt werden.
Bootstrap-Bewertung der Unterstützung
Das Resampling von Merkmalen mit Zurücklegen und der Neuaufbau von Bäumen schätzt, wie stark die Daten jede Klade unterstützen, und liefert ein Standardmaß für die Konfidenz in abgeleitete Beziehungen.

Mechanisms

Distanzmethoden wie Neighbor-Joining wandeln Sequenzunterschiede in eine Matrix um und erstellen einen Baum durch Clustering, was Geschwindigkeit bei einem gewissen Informationsverlust bietet. Parsimonie wählt den Baum, der die wenigsten Merkmalsänderungen erfordert. Maximum-Likelihood- und Bayessche Methoden verwenden explizite Substitutionsmodelle, die ungleiche Basenfrequenzen, Transition-Transversion-Bias und Ratenvariation zwischen den Stellen berücksichtigen, und suchen nach dem Baum (und den Parametern), der die Daten am besten erklärt. Die Unterstützung wird durch den Bootstrap für Likelihood und Parsimonie oder durch posteriore Wahrscheinlichkeiten in der Bayesschen Analyse bewertet. Long-Branch Attraction und Modellfehlspezifikation können zu fälschlicherweise hochkonfidenten Bäumen führen, daher sind die Methodenwahl und die Modelladäquanz von Bedeutung.

Clinical relevance

Phylogenetische Inferenz rekonstruiert die Übertragungsgeschichten von Viren und Bakterien, identifiziert die Quelle von Ausbrüchen und datiert das Auftreten resistenter oder virulenter Stämme, was sie zu einem Kernwerkzeug der genomischen Epidemiologie macht.

History

Kladistische und Distanzmethoden entstanden in den 1960er-1970er Jahren; Saitou und Nei führten 1987 Neighbor-Joining ein, und Felsenstein leistete Pionierarbeit bei der Maximum Likelihood für Sequenzen und 1985 beim Bootstrap für Phylogenien. Bayessche Inferenz und immer größere genomische Datensätze sind seitdem Standard geworden.

Debates

Parsimonie versus modellbasierte Methoden
Eine langjährige methodische Debatte betrifft die Frage, ob Parsimonie oder explizite probabilistische Modelle zuverlässigere Bäume liefern, insbesondere wenn die Änderungsraten ungleichmäßig sind und die Long-Branch Attraction ein Risiko darstellt.

Key figures

  • Joseph Felsenstein
  • Masatoshi Nei
  • Naruya Saitou
  • Willi Hennig

Related topics

Seminal works

  • saitouNei1987
  • felsenstein1985
  • felsensteinBook2004

Frequently asked questions

Welche Methode liefert den korrekten Evolutionsbaum?
Keine Methode ist garantiert korrekt; modellbasierte Methoden wie Maximum Likelihood und Bayessche Inferenz werden im Allgemeinen für Sequenzdaten bevorzugt, aber alle Methoden können durch ungleichmäßige Evolutionsraten und Modellverletzungen in die Irre geführt werden, daher sind Unterstützungsmaße unerlässlich.
Was bedeutet ein Bootstrap-Wert?
Ein Bootstrap-Wert spiegelt wider, wie oft eine bestimmte Gruppierung wiederkehrt, wenn die Daten neu abgetastet und der Baum neu aufgebaut werden; hohe Werte zeigen an, dass die Gruppierung durch die analysierten Merkmale stark unterstützt wird.

Methods for this concept

Related concepts