Modèles bayésiens hiérarchiques
Les modèles bayésiens hiérarchiques partagent l'information entre des unités apparentées en attribuant à leurs paramètres une distribution a priori commune, ce qui conduit à une mise en commun partielle (partial pooling) qui améliore les estimations pour chaque groupe.
Definition
Un modèle bayésien hiérarchique attribue une distribution a priori aux paramètres spécifiques à chaque groupe, laquelle dépend elle-même de paramètres de niveau supérieur dotés de leurs propres (hyper)priori, de sorte que l'information est empruntée entre les groupes et que l'incertitude se propage à travers tous les niveaux de la hiérarchie.
Scope
Ce domaine couvre la structure des modèles multiniveaux et la mise en commun partielle, le rôle des hyper-priori sur les paramètres au niveau de la population, la contraction (shrinkage) résultante des estimations de groupe vers la moyenne globale, et l'approximation bayésienne empirique qui estime la distribution a priori à partir des données.
Sub-topics
Core questions
- Comment une distribution a priori hiérarchique induit-elle une mise en commun partielle entre les groupes ?
- Quels rôles les hyperparamètres et les hyper-priori jouent-ils dans le modèle ?
- Pourquoi et comment les estimations au niveau des groupes sont-elles contractées vers la moyenne de la population ?
- Comment la méthode de Bayes empirique (empirical Bayes) approxime-t-elle une analyse hiérarchique complète ?
Key concepts
- modèle multiniveau
- mise en commun partielle
- hyperparamètre
- hyper-prior
- contraction
- effets aléatoires
- Bayes empirique
- emprunt de force
Key theories
- Mise en commun partielle
- En estimant les paramètres de groupe conjointement sous une distribution a priori partagée, les modèles hiérarchiques interpolent entre l'absence de mise en commun et la mise en commun complète, le degré de mise en commun étant déterminé par les données.
- Contraction et effet de Stein
- La contraction des estimations de groupe vers la moyenne de la population réduit l'erreur d'estimation totale, un phénomène lié à l'inadmissibilité de la moyenne échantillon en plusieurs dimensions, démontrée par l'estimateur de Stein.
Clinical relevance
Les modèles hiérarchiques sont l'outil standard pour la méta-analyse, les essais cliniques multicentriques, l'estimation sur petites zones et tout contexte comportant de nombreux groupes apparentés, car la mise en commun partielle stabilise les estimations lorsque les données sont rares.
History
Lindley et Smith ont formalisé le modèle hiérarchique linéaire bayésien en 1972, s'appuyant sur les travaux de Stein et de Bayes empirique des années 1950-1970 qui ont révélé les avantages de la contraction. Les avancées computationnelles ont ensuite rendu la modélisation hiérarchique entièrement bayésienne courante dans divers domaines appliqués.
Debates
- Distributions a priori sur les composantes de la variance
- Le choix de l'hyper-prior pour les variances au niveau des groupes affecte fortement la contraction lorsque les groupes sont peu nombreux, et il existe une discussion continue sur les distributions a priori faiblement informatives qui se comportent le mieux.
Key figures
- Dennis Lindley
- Adrian Smith
- Bradley Efron
- Carl Morris
- Andrew Gelman
Related topics
Seminal works
- gelman2013
- efron1975
Frequently asked questions
- Qu'est-ce que la mise en commun partielle ?
- La mise en commun partielle estime le paramètre de chaque groupe en utilisant à la fois ses propres données et les informations des autres groupes via une distribution a priori partagée, produisant des estimations qui se situent entre des analyses entièrement séparées (pas de mise en commun) et entièrement combinées (mise en commun complète).
- Pourquoi les estimations hiérarchiques sont-elles 'contractées' ?
- Parce que la distribution a priori partagée tire l'estimation de chaque groupe vers la moyenne globale d'une quantité qui dépend du niveau de bruit des données de ce groupe ; les groupes plus bruyants sont davantage contractés, ce qui réduit l'erreur globale.