Modèles multiniveaux et de regroupement partiel
Les modèles multiniveaux permettent aux coefficients de régression de varier selon les groupes tout en les liant par le biais d'une distribution de population, produisant ainsi des estimations partiellement regroupées.
Definition
Un modèle multiniveau est une régression dans laquelle certains coefficients peuvent différer d'un groupe à l'autre et sont eux-mêmes modélisés comme des tirages issus d'une distribution commune, de sorte que les estimations au niveau du groupe sont partiellement regroupées vers le modèle de population.
Scope
Ce sujet couvre les structures à ordonnée à l'origine variable et à pente variable, la distribution de population qui relie les coefficients de groupe, la formule du poids de regroupement partiel, et la relation avec les modèles classiques à effets mixtes et à effets aléatoires.
Core questions
- Comment les modèles à ordonnée à l'origine variable et à pente variable sont-ils spécifiés ?
- Qu'est-ce qui détermine le degré de regroupement pour un groupe donné ?
- Comment les modèles multiniveaux se rapportent-ils aux modèles fréquentistes à effets mixtes ?
- Comment les prédicteurs au niveau du groupe sont-ils incorporés au niveau supérieur ?
Key concepts
- ordonnées à l'origine variables
- pentes variables
- distribution de population
- facteur de regroupement
- prédicteurs au niveau du groupe
- modèle à effets mixtes
- effets aléatoires
Key theories
- Distribution de population au niveau du groupe
- Modéliser les coefficients de groupe comme des tirages échangeables issus d'une distribution de population est ce qui couple les groupes et produit un regroupement partiel déterminé par les variances intra-groupe et inter-groupes.
- Facteur de regroupement
- Le poids accordé à la moyenne de la population par rapport à l'estimation propre d'un groupe dépend du rapport entre la variance d'échantillonnage et la variance au niveau du groupe, de sorte que les groupes épars ou bruyants sont regroupés plus fortement.
Clinical relevance
Les modèles multiniveaux gèrent les données groupées et longitudinales, telles que les patients au sein des hôpitaux ou les mesures répétées chez les sujets, fournissant des estimations de groupe stables et une incertitude correcte lorsque la taille des groupes varie.
History
Le modèle hiérarchique linéaire bayésien a été présenté par Lindley et Smith en 1972. La formulation à ordonnée à l'origine variable et à pente variable, popularisée par Gelman et Hill en 2007, a rendu la modélisation multiniveau accessible aux chercheurs appliqués de toutes les disciplines.
Key figures
- Dennis Lindley
- Adrian Smith
- Andrew Gelman
- Jennifer Hill
Related topics
Seminal works
- gelman2007
- lindley1972
Frequently asked questions
- Quand devrais-je laisser les pentes varier, et pas seulement les ordonnées à l'origine ?
- Permettez à un coefficient de varier selon le groupe lorsque l'effet d'un prédicteur est susceptible de différer d'un groupe à l'autre ; les pentes variables capturent cette hétérogénéité, tandis que les ordonnées à l'origine variables ajustent seulement le niveau de base.