Monte Carlo Hamiltoniano
El Monte Carlo Hamiltoniano utiliza gradientes de la log-posterior y dinámicas físicas simuladas para proponer movimientos distantes y de alta aceptación, lo que permite un muestreo eficiente en altas dimensiones.
Definition
El Monte Carlo Hamiltoniano es un método MCMC que introduce variables de momento auxiliares, simula la dinámica hamiltoniana utilizando el gradiente de la log-posterior para proponer un nuevo estado y lo acepta con un paso de Metropolis que corrige el error de integración numérica.
Scope
Este tema abarca el aumento de la posterior con variables de momento, la integración leapfrog de la dinámica hamiltoniana, la corrección de Metropolis para el error de discretización y el muestreador No-U-Turn (NUTS) que automatiza el ajuste de la longitud de la trayectoria y el tamaño del paso.
Core questions
- ¿Cómo producen las variables de momento y la dinámica hamiltoniana propuestas eficientes?
- ¿Qué es el integrador leapfrog y por qué es necesaria la corrección de Metropolis?
- ¿Cómo elimina el muestreador No-U-Turn la necesidad de ajustar manualmente la longitud de la trayectoria?
- ¿Por qué el HMC escala mejor que los métodos de paseo aleatorio en altas dimensiones?
Key concepts
- variables de momento
- integrador leapfrog
- dinámica hamiltoniana
- tamaño del paso
- longitud de la trayectoria
- muestreador No-U-Turn
- gradiente de la log-posterior
Key theories
- Dinámica hamiltoniana para el muestreo
- Aumentar el objetivo con momento gaussiano y seguir dinámicas que conservan el volumen y la energía permite que el muestreador atraviese la posterior con alta aceptación y baja correlación entre estados sucesivos.
- Muestreador No-U-Turn
- NUTS elige automáticamente las longitudes de trayectoria extendiendo la ruta hasta que comienza a retroceder, y combina esto con la adaptación del tamaño del paso para eliminar la mayor parte del ajuste manual.
Clinical relevance
El Monte Carlo Hamiltoniano, especialmente a través de NUTS, es el muestreador predeterminado en sistemas de programación probabilística como Stan y PyMC, lo que permite ajustar modelos jerárquicos complejos en farmacometría, ecología y ciencias físicas.
History
El Monte Carlo Híbrido fue introducido para la cromodinámica cuántica de la red por Duane y sus colegas en 1987; Neal lo adaptó y popularizó para la estadística, y el muestreador No-U-Turn de Hoffman y Gelman de 2014 lo hizo práctico para usuarios generales, anclando la programación probabilística moderna.
Debates
- Sensibilidad a la geometría y al ajuste
- HMC puede tener dificultades con posteriores fuertemente curvadas o multimodales y requiere información de gradiente, lo que impulsa el trabajo en variantes adaptativas y de variedades riemannianas.
Key figures
- Radford Neal
- Simon Duane
- Matthew Hoffman
- Andrew Gelman
- Michael Betancourt
Related topics
Seminal works
- neal2011
- hoffman2014
Frequently asked questions
- ¿Por qué HMC es más rápido que el Metropolis de paseo aleatorio?
- Al utilizar información de gradiente para proponer trayectorias largas que siguen los contornos de la posterior, HMC produce muestras casi independientes con alta aceptación, evitando la lenta exploración difusiva de los métodos de paseo aleatorio en altas dimensiones.
- ¿Qué requiere HMC que los muestreadores más simples no requieren?
- Requiere el gradiente de la log-posterior con respecto a parámetros continuos, por lo que generalmente se combina con la diferenciación automática y no puede manejar directamente parámetros discretos.