Vérifications prédictives a posteriori
Les vérifications prédictives a posteriori évaluent l'adéquation absolue d'un modèle en comparant les données observées aux données simulées à partir du modèle ajusté.
Definition
Une vérification prédictive a posteriori génère des données répliquées à partir de la distribution prédictive a posteriori d'un modèle ajusté et compare les caractéristiques de ces réplications aux mêmes caractéristiques des données observées, signalant les divergences systématiques comme preuve d'une inadéquation du modèle.
Scope
Ce sujet aborde la simulation d'ensembles de données répliqués à partir de la distribution prédictive a posteriori, l'utilisation de quantités test et de mesures de divergence, les vérifications graphiques et les valeurs p prédictives a posteriori, ainsi que leur interprétation comme une vérification de cohérence interne plutôt qu'un test d'hypothèse.
Core questions
- Comment les ensembles de données répliqués sont-ils tirés de la distribution prédictive a posteriori ?
- Que sont les quantités test et les mesures de divergence, et comment sont-elles choisies ?
- Comment une valeur p prédictive a posteriori est-elle calculée et interprétée ?
- Pourquoi la vérification prédictive a posteriori est-elle une vérification de l'adéquation plutôt qu'une règle de sélection de modèle ?
Key concepts
- distribution prédictive a posteriori
- données répliquées
- quantité test
- mesure de divergence
- valeur p prédictive a posteriori
- vérification graphique de modèle
Key theories
- Comparaison de données répliquées
- Si un modèle est adéquat, les données simulées à partir de celui-ci devraient ressembler aux données observées à des égards pertinents ; des différences systématiques dans les quantités test choisies révèlent les points faibles du modèle.
- Valeurs p prédictives a posteriori
- La valeur p prédictive a posteriori est la probabilité qu'une mesure de divergence pour les données répliquées dépasse celle pour les données observées ; c'est un outil graphique et diagnostique, conservateur et non un test fréquentiste calibré.
Clinical relevance
Les vérifications prédictives a posteriori permettent aux analystes de détecter une inadéquation importante du modèle avant de rapporter leurs conclusions, ce qui est crucial dans toute analyse bayésienne appliquée où un modèle inadéquat pourrait induire en erreur les décisions.
History
Rubin a proposé la vérification prédictive bayésienne en 1984 ; Gelman, Meng et Stern l'ont étendue en 1996 avec des divergences réalisées dépendant des paramètres. Cette approche est devenue une pratique courante dans les flux de travail bayésiens appliqués, souvent par le biais de vérifications graphiques.
Debates
- Double utilisation des données
- Étant donné que les mêmes données informent à la fois le modèle ajusté et la vérification, les valeurs p prédictives a posteriori sont conservatrices et ne sont pas uniformément distribuées sous l'hypothèse nulle, ce qui a conduit à proposer des alternatives telles que les vérifications par validation croisée.
Key figures
- Donald Rubin
- Andrew Gelman
- Xiao-Li Meng
- Hal Stern
Related topics
Seminal works
- gelman1996
- rubin1984
Frequently asked questions
- Une valeur p prédictive a posteriori proche de 0,5 signifie-t-elle que mon modèle est correct ?
- Non. Les vérifications prédictives a posteriori peuvent révéler une inadéquation dans les caractéristiques que vous testez, mais ne peuvent pas confirmer qu'un modèle est correct ; une valeur p non extrême signifie seulement que le modèle n'est pas contredit par cette quantité test particulière.