標本分布と中心極限定理
標本分布とは、標本平均のような統計量が、与えられたサイズの全ての可能な標本において取りうる確率分布のことです。中心極限定理は、十分に大きな標本に対しては、基礎となるデータの形状に関わらず、標本平均の標本分布が近似的に正規分布に従うと述べています。これら二つは、正規分布に基づく信頼区間や検定がなぜ広く機能するのかを説明します。
Definition
標本分布とは、母集団から抽出された固定サイズの全ての可能な標本において、ある統計量が取りうる値の分布のことです。中心極限定理は、標本サイズが増加するにつれて、標本平均の標本分布が母集団の形状に関わらず正規分布に近づくことを述べています。
Scope
本項目では、標本分布の概念、そのばらつきとしての標準誤差、中心極限定理と標本サイズが果たす役割、そして個体の標準偏差と統計量の標準誤差の区別について扱います。これらの考え方を信頼区間や仮説検定と関連付けます。これは方法論的な参照であり、臨床的なガイダンスではありません。
Core questions
- 統計量の標本分布とは何ですか、そしてなぜそれが重要なのでしょうか?
- 標準誤差は標準偏差とどのように異なりますか?
- 中心極限定理は何を保証し、どのような条件下で適用されますか?
- 標本サイズは推定量の精度にどのように影響しますか?
Key concepts
- 統計量と母数
- 標本分布
- 標準誤差
- 標準誤差と標準偏差
- 標本サイズと精度
- 平均の近似正規性
- 信頼区間と検定の基礎
Key theories
- 中心極限定理
- 有限の分散を持つ母集団からの独立な観測値について、標本平均の分布は標本サイズが増加するにつれて、母集団の形状に関わらず正規分布に近づきます。これは、個々の測定値が非正規分布であっても、平均に対する正規分布に基づく推測を正当化します。
Mechanisms
もし同じサイズの標本が母集団から繰り返し抽出された場合、平均のような統計量は標本ごとに変動します。これらの値の分布が標本分布であり、その標準偏差が標準誤差です。標本平均の場合、標準誤差は母集団の標準偏差を標本サイズの平方根で割ったものに等しいため、標本が大きくなるにつれて精度は向上しますが、その改善はnの平方根に比例します。中心極限定理は、観測値が独立であり分散が有限である限り、データ自体が歪んでいても、十分に大きな標本に対してはこの標本分布が近似的に正規分布に従うことを付け加えています。これが古典的な推測統計の原動力です。平均の信頼区間は、近似的な正規性の下で、推定値から標準誤差の数倍だけ離れた範囲として構築され、多くの仮説検定は推定値をその標本分布と比較します。標本サイズとともに縮小する標準誤差は、母集団のばらつきを推定し、縮小しない個々の観測値の標準偏差とは区別されなければなりません。
Clinical relevance
臨床研究や公衆衛生研究で報告される信頼区間とp値は、推定量の標本分布と中心極限定理に基づいているため、これらを理解することは報告された効果の精度を判断するのに役立ちます。本項目は方法論的な背景であり、個々の臨床的決定の根拠となるものではありません。
History
中心極限定理の初期の形式は、ド・モアブルによる二項分布の正規近似や、1810年頃のラプラスの研究に現れました。厳密な一般条件は、1900年頃にリャプノフらによって確立されました。標本分布の視点は20世紀初頭に推測統計の中心となり、生物統計学における正規分布に基づく信頼区間や検定の標準的な根拠として現在も残っています。
Debates
- 中心極限定理が適用されるためには、標本はどのくらい大きくなければなりませんか?
- 近似の精度は標本サイズとともに向上しますが、十分に大きいかどうかの判断はデータの歪度によって異なります。著しく歪んだ分布の場合、平均の分布が許容できるほど正規分布に近づくためにははるかに大きな標本が必要となるため、全ての場合に当てはまる単一の経験則はありません。
Key figures
- Pierre-Simon Laplace
- Abraham de Moivre
- Aleksandr Lyapunov
Related topics
Seminal works
- altman-bland-2005-se
- rosner-2015
Frequently asked questions
- 標準偏差と標準誤差の違いは何ですか?
- 標準偏差は個々の観測値のばらつきを測定するのに対し、標準誤差は標本平均のような統計量が標本間で取りうるばらつきを測定します。標準誤差は標本サイズが増加するにつれて減少しますが、標準偏差は固定された母集団の量を推定します。
- データが歪んでいる場合でも、なぜ平均に対して正規分布を使用できるのですか?
- 中心極限定理は、標本平均の標本分布がデータの形状に関わらず、標本サイズが増加するにつれて近似的に正規分布になることを述べています。そのため、個々の値が正規分布に従わない場合でも、十分に大きな標本があれば、平均に対する正規分布に基づく手法はしばしば有効です。