第一種過誤と第二種過誤
第一種過誤と第二種過誤は、仮説検定が誤った結論に達する二つの方法です。第一種過誤は偽陽性であり、真の帰無仮説を棄却し、存在しない効果を主張することです。一方、第二種過誤は偽陰性であり、実際には存在する効果を検出できないことです。有意水準は第一種過誤の発生率を制御し、第二種過誤発生率の補数は統計的検出力であるため、これら二つの過誤タイプは、研究デザインにおいて過剰な主張と過少な主張のリスクのバランスをどのように取るかを決定します。
Definition
第一種過誤は、実際には真である帰無仮説を棄却すること(偽陽性)であり、確率アルファで発生します。第二種過誤は、実際には偽である帰無仮説を棄却できないこと(偽陰性)であり、確率ベータで発生します。
Scope
このトピックでは、これら二つの過誤タイプを定義し、それらを有意水準(アルファ)と第二種過誤発生率(ベータ)に結びつけ、研究デザインにおけるそれらのトレードオフについて説明します。これは、研究を評価し計画するための参照方法論であり、臨床的な意思決定規則ではありません。
Core questions
- 偽陽性の結論と偽陰性の結論を出すとは、それぞれどのような意味ですか?
- 有意水準と第二種過誤発生率は、これらの過誤とどのように関連していますか?
- 一方の過誤発生率を下げると、もう一方が上がるのはなぜですか?
- サンプルサイズは、各過誤の発生確率にどのように影響しますか?
Key concepts
- 第一種過誤(偽陽性)
- 第二種過誤(偽陰性)
- 有意水準(アルファ)
- 第二種過誤発生率(ベータ)
- 検出力(1-ベータ)
- 過誤のトレードオフ
- 多重検定と偽陽性の膨張
Mechanisms
ネイマン・ピアソン方式では、許容できる第一種過誤発生率(アルファ、有意水準)を事前に設定することで検定が設計され、これにより真の帰無仮説が誤って棄却される頻度が決定されます。第二種過誤発生率(ベータ)は、特定の大きさの真の効果を見逃す確率であり、1からベータを引いたものが検定の検出力となります。サンプルサイズが固定されている場合、二つの過誤発生率はトレードオフの関係にあります。偽陽性を減らすために検定を厳しくすると、偽陰性の可能性が高まり、その逆もまた然りです。サンプルサイズを増やすことが、両方を同時に減らす主要な方法です。調整なしに多くの仮説を検定すると、全体の第一種過誤発生率が膨張するため、多重性は繰り返し設計上の懸念事項となります。
Clinical relevance
これらの過誤タイプは、試験や観察研究の結論がどのように誤解を招く可能性があるかの根底にあります。偽陽性の発見は効果のない介入を促進する可能性があり、偽陰性の発見は有用な介入を却下する可能性があります。研究が過誤発生率を制御しているか、そして帰無結果が単に低い検出力を反映しているに過ぎないのかを読み取ることは、エビデンス評価の核心です。この項目は推論上の過誤を説明するものであり、個々の臨床的決定の根拠となるものではありません。
Evidence & guidelines
方法論的な解説では、検出力の低い研究では第二種過誤が発生しやすいため、非有意な結果が効果がないことの証明ではないと強調されています。アルトマンとブランドの「エビデンスの欠如は欠如のエビデンスではない」という言葉は、この点を直接的に捉えています。ボタンらの神経科学における分析のような、検出力の低い研究のレビューは、低い検出力が偽陰性を増加させ、有意な発見の信頼性を低下させることを記録しています。
History
第一種と第二種の過誤の区別は、ネイマンとピアソンが1933年に仮説検定を形式化した際に導入されました。彼らは検定設計をこれら二つの過誤確率の制御として位置づけました。その実用的な結果、特に小規模研究における第二種過誤の危険性は、20世紀から21世紀にかけての健康および行動研究の方法論的批判において繰り返し取り上げられるテーマとなりました。
Debates
- 非有意な結果の解釈
- 検出力の低い研究では第二種過誤が頻繁に発生するため、非有意な発見は効果がないことを示していると誤解されがちです。方法論者は、エビデンスの欠如は欠如のエビデンスではないと強調しています。
Key figures
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- J. Martin Bland
- John P. A. Ioannidis
Related topics
Seminal works
- neyman-pearson-1933
- altman-bland-1995
Frequently asked questions
- 第一種過誤と第二種過誤の違いは何ですか?
- 第一種過誤は偽陽性であり、効果がないのに効果があると結論付けることです。第二種過誤は偽陰性であり、実際には存在する効果を見逃すことです。それぞれの確率はアルファとベータと呼ばれます。
- 両方の過誤発生率を可能な限り小さくできないのはなぜですか?
- サンプルサイズが固定されている場合、両者にはトレードオフの関係があります。偽陽性を減らすために検定を厳しくすると、偽陰性が増加します。両方を同時に減らす主な方法は、サンプルサイズを増やすことです。