Partielle Kleinste-Quadrate-Regression
Die partielle Kleinste-Quadrate-Regression erstellt eine kleine Anzahl latenter Komponenten aus den Prädiktoren, die eine hohe Kovarianz mit den Antworten aufweisen, was eine Vorhersage ermöglicht, wenn Prädiktoren zahlreich und kollinear sind.
Definition
Die partielle Kleinste-Quadrate-Regression ist eine Methode, die orthogonale latente Komponenten als Linearkombinationen der Prädiktoren extrahiert, die so gewählt werden, dass ihre Kovarianz mit den Antworten maximiert wird, und die Antworten auf diese Komponenten regressiert.
Scope
Dieses Thema behandelt die Konstruktion latenter Komponenten durch Maximierung der Kovarianz zwischen Prädiktor- und Antwortblöcken, den Kontrast zur Hauptkomponentenregression und der gewöhnlichen Kleinste-Quadrate-Regression, den Umgang mit vielen korrelierten oder hochdimensionalen Prädiktoren, die Auswahl der Anzahl der Komponenten mittels Kreuzvalidierung und die prominente Rolle der Methode in der Chemometrie.
Core questions
- Wie können Antworten vorhergesagt werden, wenn es viele hochkorrelierte Prädiktoren gibt?
- Wie unterscheidet sich die kovarianzbasierte Komponentenextraktion von den varianzbasierten Hauptkomponenten?
- Wie viele latente Komponenten sollten beibehalten werden?
- Warum ist die Methode für die Chemometrie von zentraler Bedeutung?
Key theories
- Kovarianzmaximierende Komponenten
- Im Gegensatz zur Hauptkomponentenregression, die Komponenten maximaler Prädiktorvarianz extrahiert, extrahiert die partielle Kleinste-Quadrate-Regression Komponenten maximaler Kovarianz mit den Antworten, wodurch die Reduktion auf die Vorhersage ausgerichtet wird.
- Regression auf latenten Strukturen
- Durch die Regression der Antworten auf einige wenige extrahierte latente Komponenten anstatt auf die ursprünglichen Prädiktoren stabilisiert die Methode die Schätzung, wenn Prädiktoren kollinear sind oder die Anzahl der Beobachtungen übersteigen.
Clinical relevance
Die partielle Kleinste-Quadrate-Regression ist das Kernstück der Chemometrie und wird häufig in der Spektroskopie, Genomik und anderen Bereichen mit vielen korrelierten Prädiktoren und wenigen Stichproben eingesetzt, wo die gewöhnliche Kleinste-Quadrate-Regression instabil ist.
History
Die partiellen kleinsten Quadrate entstanden aus Herman Wolds iterativen Schätzmethoden und wurden von Svante Wold und Kollegen zu einem Regressionswerkzeug für die Chemometrie entwickelt, wo hochdimensionale, kollineare Spektraldaten sie besonders wertvoll machten.
Debates
- Interpretation latenter Komponenten
- Die latenten Komponenten sind Kombinationen aller Prädiktoren und können schwer zu interpretieren sein, und die relativen Vorzüge der partiellen Kleinste-Quadrate-Regression gegenüber penalisierten Regressionsmethoden für hochdimensionale Vorhersagen werden diskutiert.
Key figures
- Herman Wold
- Svante Wold
Related topics
Seminal works
- hastie2009
- wold2001
- johnson2007
Frequently asked questions
- Wie unterscheidet sich PLS von der Hauptkomponentenregression?
- Die Hauptkomponentenregression wählt Komponenten, die allein die Prädiktorvarianz erklären, während die partielle Kleinste-Quadrate-Regression Komponenten wählt, die auch eine hohe Kovarianz mit den Antworten aufweisen, was oft eine bessere Vorhersage mit weniger Komponenten ermöglicht.
- Wann ist PLS besonders nützlich?
- Wenn Prädiktoren hochgradig kollinear oder weitaus zahlreicher sind als Beobachtungen, wie bei spektroskopischen und genomischen Daten, wo die gewöhnliche Kleinste-Quadrate-Regression nicht zuverlässig angewendet werden kann.