Versteckte Markov-Modelle
Ein verstecktes Markov-Modell koppelt eine unbeobachtete Markov-Kette mit Beobachtungen, deren Verteilung vom aktuellen versteckten Zustand abhängt, sodass die latenten Dynamiken indirekt aus den Daten abgeleitet werden müssen.
Definition
Ein verstecktes Markov-Modell ist ein stochastischer Prozess, bei dem eine unbeobachtete diskrete Markov-Kette das Regime steuert und zu jedem Zeitpunkt eine Beobachtung aus einer Verteilung gezogen wird, die durch den aktuellen versteckten Zustand bestimmt ist, sodass die Beobachtungen unter der Bedingung des versteckten Pfades bedingt unabhängig sind.
Scope
Dieses Thema behandelt die doppelt stochastische Struktur einer latenten Markov-Kette mit zustandsabhängigen Emissionen, den Vorwärts-Rückwärts-Algorithmus für Filterung und Glättung, den Viterbi-Algorithmus für den wahrscheinlichsten Zustandspfad, die Parameterschätzung mittels des Baum-Welch-Erwartungs-Maximierungs-Verfahrens sowie die Identifizierbarkeit und asymptotische Theorie des Modells.
Core questions
- Wie erzeugt eine unbeobachtete Markov-Kette die beobachtete Sequenz?
- Wie werden die Wahrscheinlichkeiten der versteckten Zustände unter Berücksichtigung der Beobachtungen berechnet?
- Wie wird die wahrscheinlichste Sequenz versteckter Zustände gefunden?
- Wie werden die Übergangs- und Emissionsparameter des Modells aus Daten geschätzt?
Key theories
- Vorwärts-Rückwärts-Algorithmus
- Rekursive Vorwärts- und Rückwärtsläufe berechnen effizient die Wahrscheinlichkeit der Beobachtungen und die posteriore Verteilung jedes versteckten Zustands, was Filterung und Glättung in linearer Zeit zur Sequenzlänge ermöglicht.
- Baum-Welch-Parameterschätzung
- Ein Erwartungs-Maximierungs-Verfahren wechselt zwischen der Berechnung erwarteter Zustandsbelegungen und Übergänge unter aktuellen Parametern und der Neuschätzung der Übergangs- und Emissionsverteilungen, wodurch die Wahrscheinlichkeit bei jedem Schritt erhöht wird.
Clinical relevance
Versteckte Markov-Modelle sind zentral für die Sprach- und Handschrifterkennung, die Computerbiologie einschließlich Gensequenzierung und Sequenzalignment, Finanzmodelle mit Regimewechseln und die Verarbeitung natürlicher Sprache, überall dort, wo ein beobachtetes Signal durch eine unbeobachtete Sequenz diskreter Zustände angetrieben wird.
History
Die statistischen Grundlagen wurden in den 1960er Jahren von Baum und Petrie gelegt, der Viterbi-Algorithmus zur optimalen Dekodierung erschien 1967 im Kontext der Codierungstheorie, und Rabiners Tutorial von 1989 popularisierte den Rahmen für die Spracherkennung, wonach versteckte Markov-Modelle in der Signalverarbeitung und Bioinformatik zum Standard wurden.
Key figures
- Leonard Baum
- Ted Petrie
- Andrew Viterbi
- Lawrence Rabiner
Related topics
Seminal works
- cappe2005
- rabiner1989
Frequently asked questions
- Was ist in einem versteckten Markov-Modell versteckt?
- Die zugrunde liegende Markov-Kette von Zuständen wird nicht direkt beobachtet; es werden nur Ausgaben gesehen, deren Verteilung vom aktuellen Zustand abhängt, sodass die Zustandssequenz aus den Beobachtungen abgeleitet werden muss.
- Was berechnet der Viterbi-Algorithmus?
- Er findet die wahrscheinlichste Sequenz versteckter Zustände unter Berücksichtigung der Beobachtungen, wobei er dynamische Programmierung verwendet, um die Aufzählung exponentiell vieler Pfade zu vermeiden.