正規分布
正規分布は、ガウス分布またはベルカーブとも呼ばれ、その平均に関して対称であり、平均と標準偏差によって完全に記述される連続分布です。多くの測定値がそれに近似し、標本平均がそれに近づく傾向があるため、生物統計学において最も重要な分布であり、ほとんどの標準的な推論の基礎となっています。
Definition
正規分布は、その平均(中心)と標準偏差(広がり)という2つのパラメータによって完全に決定される、対称的でベル型の密度を持つ連続確率分布です。
Scope
この項目では、正規分布の形状とパラメータ、標準偏差とカバー率を関連付ける経験則、標準正規分布とzスコア、基準範囲、および個人の正規分布と標本平均の正規分布の区別について説明します。これは方法論的な参照であり、個々の患者に対する臨床的閾値を提供するものではありません。
Core questions
- 正規分布はどのような形状をしており、何がそれを決定するのか?
- 分布のどのくらいの割合が与えられた標準偏差の範囲内にあるのか?
- zスコアとは何か、標準化はどのように機能するのか?
- 正規性を仮定することが適切であるのはどのような場合か?
Key concepts
- 平均と標準偏差
- 対称性とベル型
- 経験則(68-95-99.7ルール)
- 標準正規分布
- zスコアと標準化
- 基準範囲
- 歪度と正規性からの逸脱
Mechanisms
正規分布は、その中心を定める平均と、その幅を設定する標準偏差という2つの数値によって決定されます。値の約68%は平均の1標準偏差内に、約95%は2標準偏差内に、約99.7%は3標準偏差内に収まります。これは、分布に実用的な有用性を与える経験則です。任意の正規変数は、平均を引いて標準偏差で割ることで標準化され、標準正規分布(平均0、標準偏差1)に従うzスコアが得られます。これにより、単一の表または式セットがすべての正規分布に適用できます。医学研究では、血液値などの測定値の基準範囲は、仮定された正規分布の中心95%から構築されることが多く、多くの統計的検定は、データまたは統計量の標本分布がほぼ正規であると仮定しています。
Clinical relevance
多くの生物学的測定値は、近似的な正規性の仮定の下で要約および比較され、基準範囲はしばしばそれから構築されるため、分布を理解することは、検査および研究結果の解釈に役立ちます。この項目は、分布を方法論として記述しており、個人の診断カットオフを設定するものではありません。
History
ベル型の曲線は、18世紀にド・モアブルによる二項分布の近似から生まれ、ラプラスとガウスによって発展しました。ガウスは測定誤差の分析にそれを使用しており、そのためガウス分布と呼ばれることもよくあります。19世紀から20世紀にかけて、それは測定された生物学的量のデフォルトモデルとなり、古典的な統計的推論の基礎となりました。
Debates
- 正規性を仮定すると誤解を招くのはどのような場合か?
- 多くの生物学的変数は対称ではなく歪んでおり、それらを正規として扱うと基準範囲や検定が歪む可能性があります。データを変換するか、分布によらない方法を使用するか、または平均に対する中心極限定理に依拠するかは、繰り返し生じる方法論的な判断です。
Key figures
- Carl Friedrich Gauss
- Pierre-Simon Laplace
- Abraham de Moivre
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
Frequently asked questions
- 68-95-99.7ルールとは何ですか?
- 正規分布の場合、値の約68%は平均の1標準偏差内に、約95%は2標準偏差内に、約99.7%は3標準偏差内に収まります。この経験則は、標準偏差をカバーされる値の割合に直接結びつけます。
- 推論で正規分布を使用するために、データは正規分布している必要がありますか?
- 常にそうとは限りません。多くの方法は、中心極限定理によって平均の標本分布がほぼ正規であることに依拠しており、これは個々の測定値が正規分布していない場合でも、サンプルが十分に大きければ成立することがあります。