Regressão por Mínimos Quadrados Parciais
A regressão por mínimos quadrados parciais constrói um pequeno número de componentes latentes a partir dos preditores que possuem alta covariância com as respostas, permitindo a previsão quando os preditores são numerosos e colineares.
Definition
A regressão por mínimos quadrados parciais é um método que extrai componentes latentes ortogonais como combinações lineares dos preditores, escolhidos para maximizar sua covariância com as respostas, e regride as respostas sobre esses componentes.
Scope
Este tópico abrange a construção de componentes latentes maximizando a covariância entre os blocos de preditores e respostas, o contraste com a regressão por componentes principais e mínimos quadrados ordinários, o tratamento de muitos preditores correlacionados ou de alta dimensão, a seleção do número de componentes por validação cruzada e o papel proeminente do método na quimiometria.
Core questions
- Como as respostas podem ser previstas quando há muitos preditores altamente correlacionados?
- Como a extração de componentes baseada na covariância difere dos componentes principais baseados na variância?
- Quantos componentes latentes devem ser retidos?
- Por que o método é central para a quimiometria?
Key theories
- Componentes que maximizam a covariância
- Ao contrário da regressão por componentes principais, que extrai componentes de variância máxima do preditor, os mínimos quadrados parciais extraem componentes de covariância máxima com as respostas, direcionando a redução para a previsão.
- Regressão em estruturas latentes
- Ao regredir as respostas em alguns componentes latentes extraídos, em vez de nos preditores originais, o método estabiliza a estimação quando os preditores são colineares ou superam o número de observações.
Clinical relevance
A regressão por mínimos quadrados parciais é a ferramenta principal da quimiometria e é amplamente utilizada em espectroscopia, genômica e outros contextos com muitos preditores correlacionados e poucas amostras, onde os mínimos quadrados ordinários são instáveis.
History
Os mínimos quadrados parciais originaram-se nos métodos de estimação iterativos de Herman Wold e foram desenvolvidos por Svante Wold e colegas em uma ferramenta de regressão para a quimiometria, onde dados espectrais de alta dimensão e colineares os tornaram especialmente valiosos.
Debates
- Interpretação de componentes latentes
- Os componentes latentes são combinações de todos os preditores e podem ser difíceis de interpretar, e os méritos relativos dos mínimos quadrados parciais versus métodos de regressão penalizada para previsão de alta dimensão são debatidos.
Key figures
- Herman Wold
- Svante Wold
Related topics
Seminal works
- hastie2009
- wold2001
- johnson2007
Frequently asked questions
- Como o PLS difere da regressão por componentes principais?
- A regressão por componentes principais escolhe componentes que explicam apenas a variância do preditor, enquanto os mínimos quadrados parciais escolhem componentes que também possuem alta covariância com as respostas, frequentemente proporcionando melhor previsão com menos componentes.
- Quando o PLS é especialmente útil?
- Quando os preditores são altamente colineares ou muito mais numerosos do que as observações, como em dados espectroscópicos e genômicos, onde os mínimos quadrados ordinários não podem ser aplicados de forma confiável.