ScholarGate
Ассистент

Численная линейная алгебра для статистики

Численная линейная алгебра для статистики — это исследование того, как матричные вычисления, лежащие в основе регрессии, многомерного анализа и оценки ковариации, выполняются точно и эффективно с конечной точностью.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Численная линейная алгебра для статистики — это применение и анализ алгоритмов матриц с конечной точностью к линейно-алгебраическим задачам статистики, главным образом к методу наименьших квадратов, вычислению ковариации и решению линейных систем, возникающих при оценивании.

Scope

Эта тема охватывает решение задач наименьших квадратов и нормальных уравнений, обусловленность матриц плана и ее статистические последствия, использование ортогональных методов для обеспечения стабильности, а также эффективную обработку больших или структурированных ковариационных матриц и матриц плана. Это статистическая специализация вычислительной линейной алгебры; сами матричные разложения рассматриваются в родственной теме.

Core questions

  • Как точно вычисляются оценки методом наименьших квадратов, когда предикторы почти коллинеарны?
  • Почему нормальные уравнения численно уступают ортогональным подходам?
  • Как обусловленность матрицы плана влияет на оценочные коэффициенты?
  • Как эффективно вычисляются большие и структурированные статистические матрицы?

Key concepts

  • Нормальные уравнения
  • Число обусловленности
  • Коллинеарность
  • Ортогонализация
  • Обратная устойчивость

Key theories

Стабильные наименьшие квадраты
Решение задачи наименьших квадратов с помощью ортогональной факторизации позволяет избежать формирования нормальных уравнений, обусловленность которых является квадратом обусловленности исходной задачи, тем самым сохраняя точность при коррелированных предикторах.
Обусловленность и коллинеарность
Близкая коллинеарность увеличивает число обусловленности матрицы плана, усиливая ошибку округления и дисперсию оценочных коэффициентов, что напрямую связывает численное свойство со статистической нестабильностью.

Clinical relevance

Точные матричные вычисления определяют, насколько надежны коэффициенты регрессии, обобщенные оценки методом наименьших квадратов и ковариационные матрицы; распознавание плохой обусловленности объясняет необъяснимую нестабильность оценок и предлагает способы устранения, такие как центрирование, масштабирование или регуляризация.

History

Разработка численно стабильных матричных алгоритмов Уилкинсоном, Голубом и другими в середине XX века постепенно была принята статистиками, которые признали, что подход к регрессии на основе нормальных уравнений является численно хрупким, и приняли ортогональные альтернативы.

Key figures

  • Gene Golub
  • Charles Van Loan
  • Kenneth Lange
  • James Wilkinson

Related topics

Seminal works

  • golub2013
  • lange2010

Frequently asked questions

Почему нормальные уравнения не рекомендуются для метода наименьших квадратов?
Формирование нормальных уравнений возводит в квадрат число обусловленности задачи, поэтому ошибка округления усиливается при коррелированных предикторах. Ортогональная факторизация решает ту же задачу наименьших квадратов без этой потери точности.
Что число обусловленности говорит статистику?
Оно измеряет, насколько малые возмущения в данных могут изменить решение. Большое число обусловленности, обычно возникающее из-за коллинеарных предикторов, предупреждает о том, что оценки коэффициентов численно и статистически нестабильны.

Methods for this concept

Related concepts