Qu'est-ce que la mise en commun partielle ?

La mise en commun partielle estime le paramètre de chaque groupe en utilisant à la fois ses propres données et les informations des autres groupes via une distribution a priori partagée, produisant des estimations qui se situent entre des analyses entièrement séparées (pas de mise en commun) et entièrement combinées (mise en commun complète).

Pourquoi les estimations hiérarchiques sont-elles 'contractées' ?

Parce que la distribution a priori partagée tire l'estimation de chaque groupe vers la moyenne globale d'une quantité qui dépend du niveau de bruit des données de ce groupe ; les groupes plus bruyants sont davantage contractés, ce qui réduit l'erreur globale.

Modèles bayésiens hiérarchiques

Les modèles bayésiens hiérarchiques partagent l'information entre des unités apparentées en attribuant à leurs paramètres une distribution a priori commune, ce qui conduit à une mise en commun partielle (partial pooling) qui améliore les estimations pour chaque groupe.

Trouver un sujet avec PaperMindBientôtFind papers & topics

Tools & resources

Télécharger les diapositives

Learn & explore

VidéoBientôt

Definition

Un modèle bayésien hiérarchique attribue une distribution a priori aux paramètres spécifiques à chaque groupe, laquelle dépend elle-même de paramètres de niveau supérieur dotés de leurs propres (hyper)priori, de sorte que l'information est empruntée entre les groupes et que l'incertitude se propage à travers tous les niveaux de la hiérarchie.

Scope

Ce domaine couvre la structure des modèles multiniveaux et la mise en commun partielle, le rôle des hyper-priori sur les paramètres au niveau de la population, la contraction (shrinkage) résultante des estimations de groupe vers la moyenne globale, et l'approximation bayésienne empirique qui estime la distribution a priori à partir des données.

Sub-topics

Core questions

Comment une distribution a priori hiérarchique induit-elle une mise en commun partielle entre les groupes ?
Quels rôles les hyperparamètres et les hyper-priori jouent-ils dans le modèle ?
Pourquoi et comment les estimations au niveau des groupes sont-elles contractées vers la moyenne de la population ?
Comment la méthode de Bayes empirique (empirical Bayes) approxime-t-elle une analyse hiérarchique complète ?

Key concepts

modèle multiniveau
mise en commun partielle
hyperparamètre
hyper-prior
contraction
effets aléatoires
Bayes empirique
emprunt de force

Key theories

Mise en commun partielle: En estimant les paramètres de groupe conjointement sous une distribution a priori partagée, les modèles hiérarchiques interpolent entre l'absence de mise en commun et la mise en commun complète, le degré de mise en commun étant déterminé par les données.
Contraction et effet de Stein: La contraction des estimations de groupe vers la moyenne de la population réduit l'erreur d'estimation totale, un phénomène lié à l'inadmissibilité de la moyenne échantillon en plusieurs dimensions, démontrée par l'estimateur de Stein.

Clinical relevance

Les modèles hiérarchiques sont l'outil standard pour la méta-analyse, les essais cliniques multicentriques, l'estimation sur petites zones et tout contexte comportant de nombreux groupes apparentés, car la mise en commun partielle stabilise les estimations lorsque les données sont rares.

History

Lindley et Smith ont formalisé le modèle hiérarchique linéaire bayésien en 1972, s'appuyant sur les travaux de Stein et de Bayes empirique des années 1950-1970 qui ont révélé les avantages de la contraction. Les avancées computationnelles ont ensuite rendu la modélisation hiérarchique entièrement bayésienne courante dans divers domaines appliqués.

Debates

Distributions a priori sur les composantes de la variance: Le choix de l'hyper-prior pour les variances au niveau des groupes affecte fortement la contraction lorsque les groupes sont peu nombreux, et il existe une discussion continue sur les distributions a priori faiblement informatives qui se comportent le mieux.

Key figures

Dennis Lindley
Adrian Smith
Bradley Efron
Carl Morris
Andrew Gelman

Seminal works

gelman2013
efron1975

Frequently asked questions

Qu'est-ce que la mise en commun partielle ?: La mise en commun partielle estime le paramètre de chaque groupe en utilisant à la fois ses propres données et les informations des autres groupes via une distribution a priori partagée, produisant des estimations qui se situent entre des analyses entièrement séparées (pas de mise en commun) et entièrement combinées (mise en commun complète).
Pourquoi les estimations hiérarchiques sont-elles 'contractées' ?: Parce que la distribution a priori partagée tire l'estimation de chaque groupe vers la moyenne globale d'une quantité qui dépend du niveau de bruit des données de ce groupe ; les groupes plus bruyants sont davantage contractés, ce qui réduit l'erreur globale.