Como o PLS difere da regressão por componentes principais?

A regressão por componentes principais escolhe componentes que explicam apenas a variância do preditor, enquanto os mínimos quadrados parciais escolhem componentes que também possuem alta covariância com as respostas, frequentemente proporcionando melhor previsão com menos componentes.

Quando o PLS é especialmente útil?

Quando os preditores são altamente colineares ou muito mais numerosos do que as observações, como em dados espectroscópicos e genômicos, onde os mínimos quadrados ordinários não podem ser aplicados de forma confiável.

Regressão por Mínimos Quadrados Parciais

A regressão por mínimos quadrados parciais constrói um pequeno número de componentes latentes a partir dos preditores que possuem alta covariância com as respostas, permitindo a previsão quando os preditores são numerosos e colineares.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

A regressão por mínimos quadrados parciais é um método que extrai componentes latentes ortogonais como combinações lineares dos preditores, escolhidos para maximizar sua covariância com as respostas, e regride as respostas sobre esses componentes.

Scope

Este tópico abrange a construção de componentes latentes maximizando a covariância entre os blocos de preditores e respostas, o contraste com a regressão por componentes principais e mínimos quadrados ordinários, o tratamento de muitos preditores correlacionados ou de alta dimensão, a seleção do número de componentes por validação cruzada e o papel proeminente do método na quimiometria.

Core questions

Como as respostas podem ser previstas quando há muitos preditores altamente correlacionados?
Como a extração de componentes baseada na covariância difere dos componentes principais baseados na variância?
Quantos componentes latentes devem ser retidos?
Por que o método é central para a quimiometria?

Key theories

Componentes que maximizam a covariância: Ao contrário da regressão por componentes principais, que extrai componentes de variância máxima do preditor, os mínimos quadrados parciais extraem componentes de covariância máxima com as respostas, direcionando a redução para a previsão.
Regressão em estruturas latentes: Ao regredir as respostas em alguns componentes latentes extraídos, em vez de nos preditores originais, o método estabiliza a estimação quando os preditores são colineares ou superam o número de observações.

Clinical relevance

A regressão por mínimos quadrados parciais é a ferramenta principal da quimiometria e é amplamente utilizada em espectroscopia, genômica e outros contextos com muitos preditores correlacionados e poucas amostras, onde os mínimos quadrados ordinários são instáveis.

History

Os mínimos quadrados parciais originaram-se nos métodos de estimação iterativos de Herman Wold e foram desenvolvidos por Svante Wold e colegas em uma ferramenta de regressão para a quimiometria, onde dados espectrais de alta dimensão e colineares os tornaram especialmente valiosos.

Debates

Interpretação de componentes latentes: Os componentes latentes são combinações de todos os preditores e podem ser difíceis de interpretar, e os méritos relativos dos mínimos quadrados parciais versus métodos de regressão penalizada para previsão de alta dimensão são debatidos.

Key figures

Herman Wold
Svante Wold

Seminal works

hastie2009
wold2001
johnson2007

Frequently asked questions

Como o PLS difere da regressão por componentes principais?: A regressão por componentes principais escolhe componentes que explicam apenas a variância do preditor, enquanto os mínimos quadrados parciais escolhem componentes que também possuem alta covariância com as respostas, frequentemente proporcionando melhor previsão com menos componentes.
Quando o PLS é especialmente útil?: Quando os preditores são altamente colineares ou muito mais numerosos do que as observações, como em dados espectroscópicos e genômicos, onde os mínimos quadrados ordinários não podem ser aplicados de forma confiável.