Mise à l'échelle multidimensionnelle
La mise à l'échelle multidimensionnelle positionne des objets dans un espace de faible dimension de manière à ce que les distances inter-objets reproduisent une matrice de dissemblances donnée aussi fidèlement que possible.
Definition
La mise à l'échelle multidimensionnelle est une famille de méthodes qui intègrent des objets sous forme de points dans un espace de faible dimension, de sorte que les distances entre les points approximent les dissemblances par paires observées selon un critère de perte choisi.
Scope
Ce sujet aborde la mise à l'échelle classique (métrique), dans laquelle une configuration est récupérée exactement à partir de distances euclidiennes via une décomposition en valeurs propres d'une matrice de distances doublement centrée, et la mise à l'échelle non métrique, qui préserve uniquement l'ordre de rang des dissemblances en minimisant un critère de stress. Il traite également de la relation avec l'analyse en coordonnées principales et de l'évaluation de l'ajustement.
Core questions
- Étant donné uniquement des dissemblances par paires, comment les objets peuvent-ils être positionnés dans un espace de faible dimension ?
- Quand une configuration peut-elle être récupérée exactement, et quand l'ajustement doit-il être optimisé de manière itérative ?
- Comment la qualité d'une solution de mise à l'échelle est-elle mesurée ?
- Comment la mise à l'échelle métrique est-elle liée à l'analyse en composantes principales et à l'analyse en coordonnées principales ?
Key theories
- Mise à l'échelle classique (métrique)
- Lorsque les dissemblances sont des distances euclidiennes, le double centrage de la matrice des distances au carré produit une matrice semi-définie positive dont les vecteurs propres principaux donnent les coordonnées, récupérant la configuration à une rotation et une translation près.
- Mise à l'échelle non métrique et minimisation du stress
- Lorsque seul l'ordre des dissemblances est significatif, une transformation monotone et une minimisation itérative d'une fonction de stress ajustent une configuration dont les distances sont liées de manière monotone aux dissemblances.
Clinical relevance
La mise à l'échelle multidimensionnelle est utilisée pour visualiser des données de similarité telles que des jugements perceptuels, des distances génétiques ou géographiques, et des proximités de documents ou de réseaux, transformant ainsi une matrice de dissemblances en une carte interprétable.
History
La mise à l'échelle métrique a été formalisée au milieu du XXe siècle et reliée aux coordonnées principales par Gower, tandis que Kruskal et Shepard ont introduit la mise à l'échelle non métrique basée sur la minimisation monotone du stress, élargissant ainsi la méthode aux données de dissemblance ordinales.
Key figures
- Warren Torgerson
- Joseph Kruskal
- John Gower
Related topics
Seminal works
- mardia1979
- coxcox2001
- borg2005
Frequently asked questions
- Comment la MDS classique est-elle liée à l'ACP ?
- Lorsque les dissemblances sont des distances euclidiennes calculées à partir de données, la mise à l'échelle classique produit la même configuration de faible dimension que l'analyse en composantes principales des données centrées.
- Qu'est-ce que le stress en mise à l'échelle multidimensionnelle ?
- Le stress est une mesure normalisée de l'écart entre les distances inter-points ajustées et les dissemblances cibles ; un stress plus faible indique une configuration mieux ajustée.