ScholarGate
Ассистент

Выборочные распределения и центральная предельная теорема

Выборочное распределение — это вероятностное распределение статистики, такой как выборочное среднее, по всем возможным выборкам заданного размера. Центральная предельная теорема утверждает, что для достаточно больших выборок выборочное распределение среднего является приблизительно нормальным независимо от формы исходных данных. Вместе они объясняют, почему доверительные интервалы и тесты, основанные на нормальном распределении, так широко применимы.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Выборочное распределение — это распределение значений, которые статистика принимала бы по всем возможным выборкам фиксированного размера из генеральной совокупности; центральная предельная теорема утверждает, что выборочное распределение выборочного среднего приближается к нормальному распределению по мере увеличения размера выборки, независимо от формы генеральной совокупности.

Scope

Статья охватывает концепцию выборочного распределения, стандартную ошибку как меру его разброса, центральную предельную теорему и роль размера выборки, а также различие между стандартным отклонением отдельных значений и стандартной ошибкой статистики. Она связывает эти идеи с доверительными интервалами и проверкой гипотез. Это методологический справочник, а не клиническое руководство.

Core questions

  • Что такое выборочное распределение статистики и почему оно важно?
  • Чем стандартная ошибка отличается от стандартного отклонения?
  • Что гарантирует центральная предельная теорема и при каких условиях?
  • Как размер выборки влияет на точность оценки?

Key concepts

  • Статистика против параметра
  • Выборочное распределение
  • Стандартная ошибка
  • Стандартная ошибка против стандартного отклонения
  • Размер выборки и точность
  • Приблизительная нормальность среднего
  • Основа доверительных интервалов и тестов

Key theories

Центральная предельная теорема
Для независимых наблюдений из генеральной совокупности с конечной дисперсией распределение выборочного среднего стремится к нормальному распределению по мере увеличения размера выборки, независимо от формы генеральной совокупности; это оправдывает вывод, основанный на нормальном распределении, для средних значений, даже когда отдельные измерения не являются нормально распределенными.

Mechanisms

Если бы из генеральной совокупности брались повторные выборки одного и того же размера, такая статистика, как среднее, варьировалась бы от выборки к выборке; распределение этих значений является выборочным распределением, а его стандартное отклонение — стандартной ошибкой. Для выборочного среднего стандартная ошибка равна стандартному отклонению генеральной совокупности, деленному на квадратный корень из размера выборки, поэтому точность улучшается по мере увеличения выборок, но только пропорционально квадратному корню из n. Центральная предельная теорема добавляет, что для достаточно больших выборок это выборочное распределение является приблизительно нормальным, даже если сами данные асимметричны, при условии, что наблюдения независимы и дисперсия конечна. Это движущая сила классического вывода: доверительный интервал для среднего строится путем отступления на определенное количество стандартных ошибок от оценки при приблизительной нормальности, и многие тесты гипотез сравнивают оценку с ее выборочным распределением. Стандартная ошибка, которая уменьшается с размером выборки, должна отличаться от стандартного отклонения отдельных наблюдений, которое оценивает разброс генеральной совокупности и не уменьшается.

Clinical relevance

Доверительные интервалы и p-значения, сообщаемые в клинических исследованиях и исследованиях общественного здравоохранения, основываются на выборочном распределении оценки и центральной предельной теореме, поэтому их понимание помогает оценивать точность сообщаемых эффектов. Эта статья является методологическим фоном и не является основой для индивидуальных клинических решений.

History

Ранние формы центральной предельной теоремы появились в нормальной аппроксимации биномиального распределения де Муавра и в работе Лапласа около 1810 года, а строгие общие условия были установлены Ляпуновым и другими около 1900 года. Точка зрения выборочного распределения стала центральной для вывода в начале двадцатого века и остается стандартным обоснованием для доверительных интервалов и тестов, основанных на нормальном распределении, в биостатистике.

Debates

Насколько большой должна быть выборка, чтобы центральная предельная теорема была применима?
Аппроксимация улучшается с увеличением размера выборки, но насколько большой является достаточно большой, зависит от того, насколько асимметричны данные; для заметно асимметричных распределений требуются гораздо большие выборки, прежде чем распределение среднего станет приемлемо нормальным, поэтому единого эмпирического правила для всех случаев не существует.

Key figures

  • Pierre-Simon Laplace
  • Abraham de Moivre
  • Aleksandr Lyapunov

Related topics

Seminal works

  • altman-bland-2005-se
  • rosner-2015

Frequently asked questions

В чем разница между стандартным отклонением и стандартной ошибкой?
Стандартное отклонение измеряет разброс отдельных наблюдений, тогда как стандартная ошибка измеряет разброс статистики, такой как выборочное среднее, по выборкам; стандартная ошибка уменьшается по мере увеличения размера выборки, в то время как стандартное отклонение оценивает фиксированную величину генеральной совокупности.
Почему мы можем использовать нормальное распределение для среднего, даже когда данные асимметричны?
Центральная предельная теорема утверждает, что выборочное распределение среднего становится приблизительно нормальным по мере увеличения размера выборки независимо от формы данных, поэтому методы, основанные на нормальном распределении, для среднего часто действительны при достаточно больших выборках, даже когда отдельные значения не распределены нормально.

Methods for this concept

Related concepts