Regresi Kuadrat Terkecil Parsial
Regresi kuadrat terkecil parsial membangun sejumlah kecil komponen laten dari prediktor yang memiliki kovarians tinggi dengan respons, memungkinkan prediksi ketika prediktor banyak dan kolinear.
Definition
Regresi kuadrat terkecil parsial adalah metode yang mengekstrak komponen laten ortogonal sebagai kombinasi linear dari prediktor yang dipilih untuk memaksimalkan kovariansnya dengan respons, dan meregresikan respons pada komponen-komponen ini.
Scope
Topik ini mencakup konstruksi komponen laten dengan memaksimalkan kovarians antara blok prediktor dan respons, kontras dengan regresi komponen utama dan kuadrat terkecil biasa, penanganan banyak prediktor yang berkorelasi atau berdimensi tinggi, pemilihan jumlah komponen dengan validasi silang, dan peran penting metode ini dalam kemometrik.
Core questions
- Bagaimana respons dapat diprediksi ketika ada banyak prediktor yang sangat berkorelasi?
- Bagaimana ekstraksi komponen berbasis kovarians berbeda dari komponen utama berbasis varians?
- Berapa banyak komponen laten yang harus dipertahankan?
- Mengapa metode ini menjadi pusat kemometrik?
Key theories
- Komponen yang memaksimalkan kovarians
- Tidak seperti regresi komponen utama, yang mengekstrak komponen varians prediktor maksimal, kuadrat terkecil parsial mengekstrak komponen kovarians maksimal dengan respons, mengarahkan reduksi menuju prediksi.
- Regresi pada struktur laten
- Dengan meregresikan respons pada beberapa komponen laten yang diekstraksi daripada pada prediktor asli, metode ini menstabilkan estimasi ketika prediktor kolinear atau melebihi jumlah observasi.
Clinical relevance
Regresi kuadrat terkecil parsial adalah tulang punggung kemometrik dan banyak digunakan dalam spektroskopi, genomik, dan pengaturan lain dengan banyak prediktor yang berkorelasi dan sedikit sampel, di mana kuadrat terkecil biasa tidak stabil.
History
Kuadrat terkecil parsial berasal dari metode estimasi iteratif Herman Wold dan dikembangkan oleh Svante Wold dan rekan-rekannya menjadi alat regresi untuk kemometrik, di mana data spektral berdimensi tinggi dan kolinear membuatnya sangat berharga.
Debates
- Interpretasi komponen laten
- Komponen laten adalah kombinasi dari semua prediktor dan sulit untuk diinterpretasikan, dan keunggulan relatif kuadrat terkecil parsial dibandingkan metode regresi terpenalti untuk prediksi berdimensi tinggi masih diperdebatkan.
Key figures
- Herman Wold
- Svante Wold
Related topics
Seminal works
- hastie2009
- wold2001
- johnson2007
Frequently asked questions
- Bagaimana PLS berbeda dari regresi komponen utama?
- Regresi komponen utama memilih komponen yang menjelaskan varians prediktor saja, sementara kuadrat terkecil parsial memilih komponen yang juga memiliki kovarians tinggi dengan respons, seringkali memberikan prediksi yang lebih baik dengan lebih sedikit komponen.
- Kapan PLS sangat berguna?
- Ketika prediktor sangat kolinear atau jauh lebih banyak daripada observasi, seperti dalam data spektroskopi dan genomik, di mana kuadrat terkecil biasa tidak dapat diterapkan secara andal.