統計的検出力とサンプルサイズ
統計的検出力とは、ある効果が実際に存在する場合に、研究がその効果を特定の大きさで検出する確率であり、正式には第二種過誤率を1から引いた値です。サンプルサイズ決定は、期待される効果量、選択された有意水準、およびデータのばらつきを考慮して、目標とする検出力を達成するために必要な参加者数を決定する計画段階です。これらは合わせて、研究がその問いに公平な回答を得るのに十分な大きさであるかどうかを決定します。
Definition
統計的検出力とは、検定が誤った帰無仮説を正しく棄却する(特定の大きさの真の効果を検出する)確率であり、サンプルサイズ決定とは、仮定された効果量とばらつきに対して、与えられた有意水準で目標とする検出力を達成するために必要な観測数を計算することです。
Scope
このトピックでは、検出力が何を意味するのか、検出力計算の4つの相互に関連する量(効果量、有意水準、検出力、サンプルサイズ)、および検出力不足の研究の結果について説明します。これは、研究の計画と評価のための参照方法論として提示されており、臨床的な意思決定規則としてではありません。
Core questions
- 研究は、探している効果をどの程度検出する可能性が高いか?
- 目標とする検出力に達するために必要な参加者数は何人か?
- 効果量、ばらつき、有意水準はサンプルサイズをどのように左右するか?
- 研究が検出力不足の場合、何が問題となるか?
Key concepts
- 統計的検出力(1マイナスベータ)
- 効果量
- 有意水準(アルファ)
- ばらつきと標準偏差
- 事前のサンプルサイズ計算
- 検出力不足の研究
- 臨床的に重要な最小差
Mechanisms
検出力、有意水準、効果量、サンプルサイズは相互に関連しており、3つを固定すると4つ目が決定されます。特定の有意水準では、真の効果量が大きくなるにつれて、ばらつきが小さくなるにつれて、そしてサンプルサイズが増加するにつれて検出力は上昇します。サンプルサイズ計算はこの関係を逆転させます。仮定された効果量(多くの場合、検出する価値のある最小値)、選択された有意水準、および目標とする検出力(慣例的に80%または90%)から始めて、必要な観測数を求めます。検出力不足は、真の効果を見逃す可能性(第二種過誤)を高めるだけでなく、有意な発見が誇張されたり誤りである可能性を高めます。なぜなら、小さな研究では、大きく、おそらく過大評価された推定値のみが閾値をクリアするためです。
Clinical relevance
試験や研究が適切に検出力を持っていたかどうかは、その結果をどのように解釈すべきかを決定します。検出力不足の研究からの非有意な結果は、安心させるというよりも、ほとんど情報を提供しません。また、サンプルサイズを事前に正当化することは、研究報告の期待される要素です。この項目は、評価および設計目的の検出力とサンプルサイズの推論を説明するものであり、個々の診断や治療の決定の根拠となるものではありません。
Evidence & guidelines
臨床試験および観察研究の報告基準では、事前のサンプルサイズ正当化が求められており、方法論的レビューでは、低い検出力による広範な害が文書化されています。Buttonらは、慢性的に検出力不足の分野は信頼性の低い文献を生み出すことを示し、AltmanとBland、およびGreenlandらによる誤解釈ガイドは、低い検出力が多くの情報を提供しない帰無結果を説明していることを強調しています。
History
検出力は、Neyman-Pearson検定フレームワークの直接的な派生物であり、その補数である第二種過誤率を定義しました。Jacob Cohenの1960年代以降の業績は、1988年のモノグラフで統合され、健康科学および行動科学全体で体系的な検出力分析と効果量の慣習を普及させました。検出力不足の研究に対する懸念は、2010年代の再現性に関する議論で強まりました。
Debates
- 慢性的な検出力不足の結果
- 持続的な低い検出力は、偽陰性を増加させるだけでなく、統計的に有意な発見が真の効果を反映する確率を低下させ、報告される効果の大きさを誇張し、文献全体の信頼性を損ないます。
Key figures
- Jacob Cohen
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- John P. A. Ioannidis
Related topics
Seminal works
- cohen-1988
- button-2013
Frequently asked questions
- 統計的検出力とは簡単に言うと何ですか?
- それは、ある効果が実際に存在する場合に、研究がその効果を特定の大きさで検出する可能性です。検出力が高いほど、真の効果を見逃す可能性が低くなります。80%の検出力が一般的な目標です。
- なぜサンプルサイズはそれほど重要なのでしょうか?
- サンプルサイズが大きいほど、検出力が高まり、推定値の精度が向上するため、研究は探している効果を確実に検出できます。サンプルサイズが小さすぎると、真の効果を見逃すリスクと、誇張された有意な発見を生み出すリスクの両方があります。