Multidimensionale Skalierung
Die multidimensionale Skalierung platziert Objekte in einem niedrigdimensionalen Raum, sodass die Abstände zwischen den Objekten eine gegebene Matrix von Unähnlichkeiten so genau wie möglich wiedergeben.
Definition
Die multidimensionale Skalierung ist eine Familie von Methoden, die Objekte als Punkte in einem niedrigdimensionalen Raum einbetten, sodass die Abstände zwischen den Punkten die beobachteten paarweisen Unähnlichkeiten unter einem gewählten Verlustkriterium annähern.
Scope
Dieses Thema behandelt die klassische (metrische) Skalierung, bei der eine Konfiguration exakt aus euklidischen Distanzen über eine Eigenzerlegung einer doppelt zentrierten Distanzmatrix rekonstruiert wird, und die nicht-metrische Skalierung, die nur die Rangordnung der Unähnlichkeiten durch Minimierung eines Stresskriteriums bewahrt. Es befasst sich mit der Beziehung zur Hauptkoordinatenanalyse und der Bewertung der Anpassungsgüte.
Core questions
- Wie können Objekte, nur basierend auf paarweisen Unähnlichkeiten, in einem niedrigdimensionalen Raum positioniert werden?
- Wann kann eine Konfiguration exakt rekonstruiert werden, und wann muss die Anpassung iterativ optimiert werden?
- Wie wird die Qualität einer Skalierungslösung gemessen?
- Wie verhält sich die metrische Skalierung zur Hauptkomponenten- und Hauptkoordinatenanalyse?
Key theories
- Klassische (metrische) Skalierung
- Wenn Unähnlichkeiten euklidische Distanzen sind, liefert die doppelte Zentrierung der quadrierten Distanzmatrix eine positiv semidefinite Matrix, deren führende Eigenvektoren die Koordinaten ergeben und die Konfiguration bis auf Rotation und Translation rekonstruieren.
- Nicht-metrische Skalierung und Stressminimierung
- Wenn nur die Reihenfolge der Unähnlichkeiten aussagekräftig ist, passen eine monotone Transformation und eine iterative Minimierung einer Stressfunktion eine Konfiguration an, deren Distanzen monoton mit den Unähnlichkeiten zusammenhängen.
Clinical relevance
Die multidimensionale Skalierung wird verwendet, um Ähnlichkeitsdaten wie perzeptuelle Urteile, genetische oder geografische Distanzen sowie Dokument- oder Netzwerkproximalitäten zu visualisieren und eine Unähnlichkeitsmatrix in eine interpretierbare Karte umzuwandeln.
History
Die metrische Skalierung wurde Mitte des 20. Jahrhunderts formalisiert und von Gower mit den Hauptkoordinaten in Verbindung gebracht, während Kruskal und Shepard die nicht-metrische Skalierung basierend auf monotoner Stressminimierung einführten und die Methode auf ordinale Unähnlichkeitsdaten erweiterten.
Key figures
- Warren Torgerson
- Joseph Kruskal
- John Gower
Related topics
Seminal works
- mardia1979
- coxcox2001
- borg2005
Frequently asked questions
- Wie hängt klassisches MDS mit der PCA zusammen?
- Wenn Unähnlichkeiten euklidische Distanzen sind, die aus Daten berechnet wurden, liefert die klassische Skalierung dieselbe niedrigdimensionale Konfiguration wie die Hauptkomponentenanalyse der zentrierten Daten.
- Was ist Stress bei der multidimensionalen Skalierung?
- Stress ist ein normalisiertes Maß für die Diskrepanz zwischen den angepassten Abständen zwischen den Punkten und den Zielunähnlichkeiten; ein niedrigerer Stresswert deutet auf eine besser passende Konfiguration hin.