Modelos ocultos de Markov
Un modelo oculto de Markov acopla una cadena de Markov no observada a observaciones cuya distribución depende del estado oculto actual, por lo que la dinámica latente debe inferirse indirectamente a partir de los datos.
Definition
Un modelo oculto de Markov es un proceso estocástico en el que una cadena de Markov de tiempo discreto no observada rige el régimen, y en cada momento se extrae una observación de una distribución determinada por el estado oculto actual, por lo que las observaciones son condicionalmente independientes dada la ruta oculta.
Scope
Este tema abarca la estructura doblemente estocástica de una cadena de Markov latente con emisiones dependientes del estado, el algoritmo de avance-retroceso para el filtrado y el suavizado, el algoritmo de Viterbi para la ruta de estado más probable, la estimación de parámetros mediante el procedimiento de expectativa-maximización de Baum-Welch, y la identificabilidad y teoría asintótica del modelo.
Core questions
- ¿Cómo genera una cadena de Markov no observada la secuencia observada?
- ¿Cómo se calculan las probabilidades de estado oculto dadas las observaciones?
- ¿Cómo se encuentra la secuencia más probable de estados ocultos?
- ¿Cómo se estiman los parámetros de transición y emisión del modelo a partir de los datos?
Key theories
- Algoritmo de avance-retroceso
- Los pases recursivos de avance y retroceso calculan la probabilidad de las observaciones y la distribución posterior de cada estado oculto de manera eficiente, lo que permite el filtrado y el suavizado en tiempo lineal con la longitud de la secuencia.
- Estimación de parámetros de Baum-Welch
- Un procedimiento de expectativa-maximización alterna entre el cálculo de las ocupaciones y transiciones de estado esperadas bajo los parámetros actuales y la reestimación de las distribuciones de transición y emisión, aumentando la probabilidad en cada paso.
Clinical relevance
Los modelos ocultos de Markov son fundamentales para el reconocimiento de voz y escritura, la biología computacional, incluida la búsqueda de genes y la alineación de secuencias, los modelos de cambio de régimen financiero y el procesamiento del lenguaje natural, dondequiera que una señal observada sea impulsada por una secuencia no observada de estados discretos.
History
Las bases estadísticas fueron sentadas por Baum y Petrie en la década de 1960, el algoritmo de Viterbi para la decodificación óptima apareció en 1967 en un contexto de teoría de la codificación, y el tutorial de Rabiner de 1989 popularizó el marco para el reconocimiento de voz, después de lo cual los modelos ocultos de Markov se convirtieron en estándar en el procesamiento de señales y la bioinformática.
Key figures
- Leonard Baum
- Ted Petrie
- Andrew Viterbi
- Lawrence Rabiner
Related topics
Seminal works
- cappe2005
- rabiner1989
Frequently asked questions
- ¿Qué está oculto en un modelo oculto de Markov?
- La cadena de Markov subyacente de estados no se observa directamente; solo se ven las salidas cuya distribución depende del estado actual, por lo que la secuencia de estados debe inferirse a partir de las observaciones.
- ¿Qué calcula el algoritmo de Viterbi?
- Encuentra la secuencia más probable de estados ocultos dadas las observaciones, utilizando programación dinámica para evitar enumerar un número exponencial de rutas.