なぜ正規性が重要なのか？

多くの一般的な要約（平均、標準偏差）と検定（t検定、ANOVA）は、おおよそ正規なデータを仮定しています。この仮定が満たされない場合、これらの尺度は誤解を招く可能性があり、ノンパラメトリックな代替手段や変換された代替手段がより適切である場合があります。

シャピロ-ウィルク検定が有意であることは、パラメトリックな手法を放棄する十分な理由となるか？

それだけでは十分ではありません。この検定は大規模なサンプルでは非常に敏感になり、小規模なサンプルでは検出力が低下するため、逸脱の大きさ、Q-Qプロットで観察される形状、および計画された分析の堅牢性をすべて考慮する必要があります。

データ分布と正規性

変数の分布は、その値が可能性のある範囲全体にどのように広がっているかを示し、多くの記述的および推論的手法は、その分布がどのような形をしているかに依存します。正規性、すなわちデータが対称的な釣鐘型の正規分布に従うかどうかは、健康研究において最も頻繁に検討される分布の仮定であり、パラメトリックな要約と検定、およびノンパラメトリックな要約と検定の選択を左右します。

PaperMindでテーマを探す近日公開Find papers & topics

Tools & resources

スライドをダウンロード

Learn & explore

動画近日公開

Definition

統計的分布は、変数の取りうる値の相対頻度または確率を記述します。正規性とは、ガウス（正規）分布との適合性を指し、これは対称的な釣鐘型の形状であり、パラメトリックな手法が適切であるかどうかを判断するために、グラフと形式的な検定を用いて評価されます。

Scope

この項目では、分布の形状（対称性、歪度、尖度）、正規分布とその重要性、および正規性がグラフによる視覚的検査と形式的な検定によってどのように評価されるかを扱います。これは方法論的な参考文献であり、臨床的ガイダンスを提供するものではありません。

Core questions

変数の分布はどのような形状をしており、対称的か歪んでいるか？
この変数にとって正規性の仮定は妥当か？
正規性を評価するのに最適なグラフツールと形式的ツールはどれか、またそれらは小規模または大規模なサンプルでどのように振る舞うか？

Key concepts

正規（ガウス）分布
歪度と尖度
グラフによる評価（ヒストグラム、Q-Qプロット）
シャピロ-ウィルク検定
コルモゴロフ-スミルノフ検定
パラメトリックとノンパラメトリックの選択
正規性検定のサンプルサイズ感度

Key theories

中心極限定理: 中心極限定理は、十分に大きなサンプルにおいて、平均の標本分布は基礎となる変数の形状に関わらず正規分布に近づくことを述べています。これは、生データが正規分布でない場合でも、正規理論に基づく手法が平均に対してしばしば有用である理由です。

Mechanisms

正規性は、相補的な2つの方法で評価されます。ヒストグラムや分位点-分位点（Q-Q）プロットなどのグラフ的手法は、歪み、裾の重さ、二峰性などの逸脱を直接示します。シャピロ-ウィルク検定が最も広く用いられる形式的な検定の一つですが、これは正規モデルの下でデータが観察される確率を返します。これらの検定はサンプルサイズが大きくなるにつれて検出力が増すため、大規模なサンプルでは些細な逸脱を検出しがちであり、小規模なサンプルでは重要な逸脱を見逃す傾向があります。したがって、グラフによる視覚的検査と非正規性の実用的な影響は、検定結果と併せて考慮されます。対象となる量が平均である場合、中心極限定理により、非正規な生データであっても正規理論に基づく手法が正当化されることがよくあります。

Clinical relevance

バイオマーカー、入院期間、またはスコアが正規であると扱われるかどうかは、臨床文献全体でそれがどのように要約され、分析されるかを決定するため、正規性の判断は研究の方法を評価する一部となります。この項目は分布の仮定の評価について記述しており、個別の診断や治療の決定の根拠となるものではありません。

Epidemiology

多くの生物学的および臨床的測定値は右に歪んでいる（例えば、ホルモンレベル、費用、待ち時間など）ため、正規性を仮定することはできず、日常的に確認されます。この決定は、結果が平均と標準偏差で報告されるか、中央値と範囲で報告されるか、またパラメトリック検定とノンパラメトリック検定のどちらが使用されるかを決定します。

History

正規分布は18世紀から19世紀にかけてド・モアブル、ラプラス、ガウスの研究で発展し、誤差の理論と中心極限定理を通じて統計学の中心的な概念となりました。仮定をチェックするための形式的なツールは20世紀に続き、シャピロとウィルクによる1965年の正規性のための分散分析検定は、応用研究における標準的な手順となりました。

Debates

正規性は形式的な検定とグラフによる視覚的検査のどちらで判断すべきか？: 形式的な正規性検定はサンプルサイズに敏感であり、大規模なサンプルでは些細な逸脱を棄却し、小規模なサンプルでは重要な逸脱を検出できないため、多くの方法論者は、検定のp値のみに頼るのではなく、グラフによる評価と計画された分析の実用的な堅牢性が決定を導くべきだと推奨しています。

Key figures

Samuel S. Shapiro
Martin B. Wilk
Carl Friedrich Gauss

Seminal works

shapiro-wilk-1965
kwak-2017
ghasemi-2012

Frequently asked questions

なぜ正規性が重要なのか？: 多くの一般的な要約（平均、標準偏差）と検定（t検定、ANOVA）は、おおよそ正規なデータを仮定しています。この仮定が満たされない場合、これらの尺度は誤解を招く可能性があり、ノンパラメトリックな代替手段や変換された代替手段がより適切である場合があります。
シャピロ-ウィルク検定が有意であることは、パラメトリックな手法を放棄する十分な理由となるか？: それだけでは十分ではありません。この検定は大規模なサンプルでは非常に敏感になり、小規模なサンプルでは検出力が低下するため、逸脱の大きさ、Q-Qプロットで観察される形状、および計画された分析の堅牢性をすべて考慮する必要があります。