ScholarGate
Assistant

Régression multivariée

La régression multivariée modélise la dépendance conjointe de plusieurs variables de réponse vis-à-vis d'un ensemble de prédicteurs, en tenant compte des corrélations entre les réponses.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

La régression multivariée est la modélisation simultanée de deux variables de réponse ou plus en tant que fonctions de prédicteurs communs, l'inférence tenant compte de la structure de covariance entre les réponses.

Scope

Ce domaine couvre le modèle linéaire général multivarié et ses spécialisations : la régression multiple multivariée avec plusieurs réponses continues, l'analyse de variance multivariée pour comparer les vecteurs de moyennes de groupes, et les méthodes prédictives de réduction de dimension telles que les moindres carrés partiels pour de nombreux prédicteurs corrélés. Il aborde l'estimation, les tests d'hypothèses via des statistiques de test multivariées, et la modélisation de la covariance des réponses.

Sub-topics

Core questions

  • Comment plusieurs réponses corrélées sont-elles modélisées conjointement sur des prédicteurs communs ?
  • Comment les hypothèses multivariées concernant la régression et les moyennes de groupes sont-elles testées ?
  • En quoi la modélisation conjointe des réponses diffère-t-elle des régressions univariées séparées ?
  • Comment de nombreux prédicteurs corrélés sont-ils gérés de manière prédictive ?

Key theories

Modèle linéaire général multivarié
Le modèle linéaire multivarié exprime une matrice de réponses comme le produit d'une matrice de conception commune par une matrice de coefficients, plus des erreurs corrélées, unifiant ainsi la régression multivariée et l'analyse de variance multivariée sous un même cadre.
Statistiques de test multivariées
Les hypothèses concernant les matrices de coefficients ou de vecteurs de moyennes sont testées à l'aide de statistiques telles que le lambda de Wilks et les critères de Pillai, de Hotelling-Lawley et de Roy, qui combinent les informations sur l'ensemble des réponses.

Clinical relevance

La régression multivariée est utilisée lorsque les résultats sont intrinsèquement multidimensionnels, comme des mesures multiples corrélées par sujet, et pour comparer des groupes sur plusieurs résultats simultanément tout en contrôlant les taux d'erreur globaux.

History

Le modèle linéaire multivarié et ses statistiques de test associées ont été développés dans la théorie classique de l'analyse multivariée durant la première moitié du XXe siècle. Plus tard, des méthodes telles que les moindres carrés partiels ont étendu la régression avec de nombreuses réponses ou prédicteurs aux contextes de haute dimensionnalité et de colinéarité courants en chimiométrie.

Debates

Choix entre les statistiques de test multivariées
Le lambda de Wilks, la trace de Pillai, la trace de Hotelling-Lawley et la plus grande racine de Roy peuvent conduire à des conclusions différentes et varier en termes de puissance et de robustesse, de sorte que le choix entre eux n'est pas toujours évident.

Key figures

  • T. W. Anderson
  • Harold Hotelling
  • Samuel Wilks

Related topics

Seminal works

  • anderson2003
  • johnson2007
  • mardia1979

Frequently asked questions

Pourquoi modéliser plusieurs réponses conjointement plutôt qu'une à la fois ?
La modélisation conjointe tient compte des corrélations entre les réponses, permet de tester des hypothèses sur toutes les réponses simultanément et contrôle le taux d'erreur global que des analyses univariées séparées augmenteraient.
Comment la régression multivariée est-elle liée à la MANOVA ?
Les deux sont des cas particuliers du modèle linéaire général multivarié ; la MANOVA est la version dans laquelle les prédicteurs encodent l'appartenance à un groupe et l'objectif est de comparer les vecteurs de moyennes entre les groupes.

Methods for this concept

Related concepts