ScholarGate
Ассистент

Регрессия методом частичных наименьших квадратов

Регрессия методом частичных наименьших квадратов строит небольшое количество латентных компонент из предикторов, которые имеют высокую ковариацию с откликами, что позволяет осуществлять прогнозирование при многочисленных и коллинеарных предикторах.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Регрессия методом частичных наименьших квадратов — это метод, который извлекает ортогональные латентные компоненты как линейные комбинации предикторов, выбранные для максимизации их ковариации с откликами, и регрессирует отклики на эти компоненты.

Scope

Эта тема охватывает построение латентных компонент путем максимизации ковариации между блоками предикторов и откликов, сравнение с регрессией на основе главных компонент и обычным методом наименьших квадратов, обработку множества коррелированных или высокоразмерных предикторов, выбор количества компонент с помощью перекрестной проверки, а также выдающуюся роль метода в хемометрике.

Core questions

  • Как можно предсказывать отклики, когда имеется много сильно коррелированных предикторов?
  • Чем извлечение компонент на основе ковариации отличается от главных компонент на основе дисперсии?
  • Сколько латентных компонент следует сохранить?
  • Почему этот метод занимает центральное место в хемометрике?

Key theories

Компоненты, максимизирующие ковариацию
В отличие от регрессии на основе главных компонент, которая извлекает компоненты с максимальной дисперсией предикторов, метод частичных наименьших квадратов извлекает компоненты с максимальной ковариацией с откликами, направляя редукцию на прогнозирование.
Регрессия на латентных структурах
Регрессируя отклики на несколько извлеченных латентных компонент, а не на исходные предикторы, метод стабилизирует оценку, когда предикторы коллинеарны или их число превышает количество наблюдений.

Clinical relevance

Регрессия методом частичных наименьших квадратов является основным инструментом хемометрики и широко используется в спектроскопии, геномике и других областях с множеством коррелированных предикторов и небольшим количеством образцов, где обычный метод наименьших квадратов нестабилен.

History

Метод частичных наименьших квадратов возник из итерационных методов оценки Германа Вольда и был разработан Сванте Вольдом и его коллегами как инструмент регрессии для хемометрики, где высокоразмерные, коллинеарные спектральные данные сделали его особенно ценным.

Debates

Интерпретация латентных компонент
Латентные компоненты представляют собой комбинации всех предикторов и могут быть сложны для интерпретации, а относительные достоинства метода частичных наименьших квадратов по сравнению с методами регуляризованной регрессии для высокоразмерного прогнозирования обсуждаются.

Key figures

  • Herman Wold
  • Svante Wold

Related topics

Seminal works

  • hastie2009
  • wold2001
  • johnson2007

Frequently asked questions

Чем PLS отличается от регрессии на основе главных компонент?
Регрессия на основе главных компонент выбирает компоненты, которые объясняют только дисперсию предикторов, в то время как метод частичных наименьших квадратов выбирает компоненты, которые также имеют высокую ковариацию с откликами, часто обеспечивая лучшее прогнозирование с меньшим количеством компонент.
Когда PLS особенно полезен?
Когда предикторы сильно коллинеарны или значительно превосходят число наблюдений, как в спектроскопических и геномных данных, где обычный метод наименьших квадратов не может быть надежно применен.

Methods for this concept

Related concepts