Comprobaciones predictivas posteriores
Las comprobaciones predictivas posteriores evalúan el ajuste absoluto del modelo comparando los datos observados con los datos simulados a partir del modelo ajustado.
Definition
Una comprobación predictiva posterior genera datos replicados a partir de la distribución predictiva posterior de un modelo ajustado y compara las características de estas replicaciones con las mismas características de los datos observados, señalando las discrepancias sistemáticas como evidencia de un desajuste del modelo.
Scope
Este tema abarca la simulación de conjuntos de datos replicados a partir de la distribución predictiva posterior, el uso de cantidades de prueba y medidas de discrepancia, las comprobaciones gráficas y los valores p predictivos posteriores, junto con su interpretación como una autocoherencia en lugar de una prueba de hipótesis.
Core questions
- ¿Cómo se extraen conjuntos de datos replicados de la distribución predictiva posterior?
- ¿Qué son las cantidades de prueba y las medidas de discrepancia, y cómo se eligen?
- ¿Cómo se calcula e interpreta un valor p predictivo posterior?
- ¿Por qué la comprobación predictiva posterior es una verificación de ajuste en lugar de una regla de selección de modelos?
Key concepts
- distribución predictiva posterior
- datos replicados
- cantidad de prueba
- medida de discrepancia
- valor p predictivo posterior
- verificación gráfica del modelo
Key theories
- Comparación de datos replicados
- Si un modelo se ajusta, los datos simulados a partir de él deben parecerse a los datos observados en aspectos relevantes; las diferencias sistemáticas en las cantidades de prueba elegidas revelan dónde falla el modelo.
- Valores p predictivos posteriores
- El valor p predictivo posterior es la probabilidad de que una medida de discrepancia para datos replicados exceda la de los datos observados; es una herramienta gráfica y diagnóstica, conservadora y no una prueba frecuentista calibrada.
Clinical relevance
Las comprobaciones predictivas posteriores permiten a los analistas detectar desajustes importantes del modelo antes de informar las conclusiones, lo cual es relevante en cualquier análisis bayesiano aplicado donde un modelo inadecuado podría llevar a decisiones erróneas.
History
Rubin propuso la comprobación predictiva bayesiana en 1984; Gelman, Meng y Stern la extendieron con discrepancias realizadas que dependían de parámetros en 1996. El enfoque se ha convertido en una práctica estándar en los flujos de trabajo bayesianos aplicados, a menudo mediante comprobaciones gráficas.
Debates
- Doble uso de los datos
- Debido a que los mismos datos informan tanto al modelo ajustado como a la comprobación, los valores p predictivos posteriores son conservadores y no se distribuyen uniformemente bajo la hipótesis nula, lo que impulsa alternativas como las comprobaciones de validación cruzada.
Key figures
- Donald Rubin
- Andrew Gelman
- Xiao-Li Meng
- Hal Stern
Related topics
Seminal works
- gelman1996
- rubin1984
Frequently asked questions
- ¿Significa un valor p predictivo posterior cercano a 0.5 que mi modelo es correcto?
- No. Las comprobaciones predictivas posteriores pueden revelar desajustes en las características que se prueban, pero no pueden confirmar que un modelo sea correcto; un valor p no extremo solo significa que el modelo no es contradicho por esa cantidad de prueba particular.