カイ二乗検定の代わりにフィッシャーの正確検定を使用すべきなのはいつですか？

表が小さいか疎である場合、典型的には1つ以上の期待セル度数が低い場合、カイ二乗の大標本近似は信頼できない可能性があり、正確な確率を計算するフィッシャーの正確検定が好まれます。

有意なカイ二乗検定は関連性の強さを示しますか？

いいえ。これらの検定は関連性の証拠があるかどうかを示します。関連性の大きさは、リスク比やオッズ比などの別の効果量によって伝えられ、これらはp値と併せて報告されるべきです。

カイ二乗検定とフィッシャーの正確検定

カイ二乗検定とフィッシャーの正確検定は、分割表における2つのカテゴリカル変数が関連しているか、あるいは独立しているかを問うための2つの標準的な手続きです。カイ二乗検定は、独立性の仮定の下で期待されるセル度数と観測されたセル度数を比較し、大標本近似を用います。一方、フィッシャーの正確検定は、観測された表の確率を直接計算し、度数が小さい場合に使用されます。

PaperMindでテーマを探す近日公開Find papers & topics

Tools & resources

スライドをダウンロード

Learn & explore

動画近日公開

Definition

関連性のカイ二乗検定は、独立性の帰無仮説の下での観測されたセル度数と期待されるセル度数の間の不一致を測定し、結果として得られる統計量をカイ二乗分布に照らします。一方、フィッシャーの正確検定は、周辺度数を固定した超幾何分布から、観測された表およびそれよりも極端な表の正確な確率を計算します。

Scope

この項目では、ピアソンのカイ二乗統計量とその自由度、カイ二乗近似を正当化する期待度数の条件、連続性（イェイツ）補正、超幾何分布に基づくフィッシャーの正確検定の論理、および近似検定を正確検定に置き換えるべき実用的な問題について説明します。これらは関連性の検定として提示されており、臨床的ガイダンスとしてではなく、関連性が存在するかどうかを評価するものであり、その大きさを示すものではないことに留意してください。

Core questions

この表の2つのカテゴリカル変数は独立しているか、それとも関連性の証拠があるか？
カイ二乗統計量は観測度数と期待度数からどのように形成され、いくつの自由度を持つか？
カイ二乗近似が信頼できないほど期待度数が小さくなるのはいつか？
フィッシャーの正確検定はどのようにして大標本近似を回避するのか、「周辺度数に条件付ける」とは何を意味するのか？

Key concepts

観測度数と期待度数
ピアソンのカイ二乗統計量
自由度 (r-1)(c-1)
大標本（漸近）近似
期待度数の経験則
イェイツの連続性補正
超幾何分布と固定周辺度数
正確なp値と漸近的なp値

Mechanisms

独立性の仮定の下では、各セルの期待度数は、その行の合計と列の合計を掛け合わせ、総計で割った値になります。ピアソンのカイ二乗統計量は、観測度数と期待度数の二乗差を期待度数で割った値をすべてのセルにわたって合計します。r×cの表の場合、この統計量は(r−1)(c−1)の自由度を持つカイ二乗分布と比較されます。この自由度の結果は、フィッシャーが1922年に明確にしました。期待度数が小さい場合、近似の精度は低下するため、期待度数は一般的に約5を超えるべきであるという一般的なガイドラインが示されています。イェイツの連続性補正は、2×2表の近似を改善するために提案されました。フィッシャーの正確検定は、行と列の周辺度数を固定し、超幾何分布から観測された表およびそれよりも極端なすべての表の正確な確率を計算し、それらを合計してp値を求めることで近似を回避します。正確であるため、疎な表に推奨されますが、レビューではその条件付きで保守的な性質が指摘されており、利用可能な検定の中から特定の選択を推奨しています。

Clinical relevance

ある研究が、ある曝露が結果と関連しているか否かを報告するかどうかは、しばしばこれらの検定のいずれかに基づいています。したがって、これらの検定が何をするのか、そして小さなp値が関連性を示すがその大きさについては何も語らないことを理解することは、健康研究を評価する上で重要です。これらの検定は関連性の証拠を評価するためのツールであり、個々の診断や治療の決定の根拠となるものではありません。

Epidemiology

カイ二乗検定とフィッシャーの正確検定は、疫学および臨床研究における2×2およびそれ以上の分割表に対するデフォルトの有意性検定であり、同じ関連性を定量化するリスク比やオッズ比と併用されます。正確検定は、カイ二乗近似が信頼できない小標本や稀な事象に対して日常的に用いられます。

History

カール・ピアソンは1900年にカイ二乗適合度統計量を導入しました。フィッシャーの1922年の論文は分割表の自由度を修正し、フィッシャーは後に小標本のために彼の名を冠した正確検定を考案しました。イェイツは1934年に2×2表の連続性補正を提案しました。これらの手続きおよび関連する手続きに関する現代の推奨は、方法論的レビューや教科書でまとめられています。

Debates

小さな2×2表に対する正確検定と漸近検定: フィッシャーの正確検定は両方の周辺度数に条件付けられ、正確ではあるが保守的になる傾向がある。一方、補正なしのカイ二乗検定は小標本では反保守的になる可能性があり、イェイツ補正は過剰補正する。したがって、レビューでは単一の規則ではなく、微妙な推奨がなされている。

Key figures

Karl Pearson
Ronald A. Fisher
Frank Yates
Alan Agresti

Seminal works

pearson-1900
fisher-1922
lydersen-2009

Frequently asked questions

カイ二乗検定の代わりにフィッシャーの正確検定を使用すべきなのはいつですか？: 表が小さいか疎である場合、典型的には1つ以上の期待セル度数が低い場合、カイ二乗の大標本近似は信頼できない可能性があり、正確な確率を計算するフィッシャーの正確検定が好まれます。
有意なカイ二乗検定は関連性の強さを示しますか？: いいえ。これらの検定は関連性の証拠があるかどうかを示します。関連性の大きさは、リスク比やオッズ比などの別の効果量によって伝えられ、これらはp値と併せて報告されるべきです。