ScholarGate
Assistant

Analyse des corrélations canoniques

L'analyse des corrélations canoniques identifie des paires de combinaisons linéaires, une de chacun de deux ensembles de variables, qui sont mutuellement corrélées au maximum.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

L'analyse des corrélations canoniques est une méthode qui, étant donné deux ensembles de variables, construit des paires successives de combinaisons linéaires non corrélées de manière à ce que chaque paire présente la corrélation la plus élevée possible, sous réserve d'être non corrélée avec les paires précédentes.

Scope

Ce sujet aborde la définition des variables canoniques et des corrélations canoniques comme solution d'un problème de valeurs propres généralisé impliquant la covariance croisée de deux ensembles de variables, leur orthogonalité successive, l'interprétation des poids canoniques (loadings), et l'intégration de la régression multiple et de l'analyse discriminante comme cas particuliers du cadre canonique.

Core questions

  • Quelles combinaisons linéaires de deux ensembles de variables sont les plus fortement associées ?
  • Combien de dimensions d'association indépendantes existent entre les deux ensembles ?
  • Comment les variables canoniques et leurs poids (loadings) sont-ils interprétés ?
  • Comment la régression et l'analyse discriminante apparaissent-elles comme des cas particuliers ?

Key theories

Les variables canoniques comme problème de valeurs propres généralisé
Les corrélations canoniques sont les racines carrées des valeurs propres d'une matrice construite à partir des matrices de covariance intra- et inter-ensembles, et les variables canoniques sont les combinaisons linéaires associées de chaque ensemble de variables.
Cadre unificateur pour l'association multivariée
La corrélation multiple, l'analyse discriminante et l'analyse des correspondances peuvent chacune être considérées comme des instances de corrélation canonique entre des ensembles de variables choisis de manière appropriée, conférant à la méthode un rôle unificateur dans l'analyse multivariée.

Clinical relevance

L'analyse des corrélations canoniques est utilisée pour relier deux blocs de mesures, tels qu'un ensemble de prédicteurs et un ensemble de résultats, ou deux modalités de données, en identifiant les dimensions de variation partagées les plus fortes entre eux.

History

L'analyse des corrélations canoniques a été introduite par Hotelling en 1936 comme méthode générale pour relier deux ensembles de variables. Elle a ensuite été développée dans le cadre de la théorie formelle de l'analyse multivariée et reconnue comme un cadre unificateur englobant plusieurs autres techniques multivariées.

Key figures

  • Harold Hotelling
  • T. W. Anderson

Related topics

Seminal works

  • anderson2003
  • mardia1979
  • johnson2007

Frequently asked questions

En quoi la corrélation canonique diffère-t-elle de la régression multiple ?
La régression multiple relie plusieurs prédicteurs à une seule réponse, tandis que la corrélation canonique relie symétriquement deux ensembles de variables, en trouvant des combinaisons de part et d'autre qui sont corrélées au maximum.
Que représente la première corrélation canonique ?
C'est la corrélation la plus élevée possible entre toute combinaison linéaire du premier ensemble de variables et toute combinaison linéaire du second, mesurant la dimension d'association la plus forte entre les deux ensembles.

Methods for this concept

Related concepts