ScholarGate
アシスタント

分割表と2×2表

分割表は、2つ(またはそれ以上)のカテゴリカル変数によってサンプルをクロス分類する度数(カウント)の長方形の配列であり、各カテゴリの組み合わせにいくつの観測値が該当するかを示すものです。健康研究において最も単純で重要な形式は2×2表であり、これは二値の曝露と二値のアウトカムをクロス集計し、関連性のほぼすべての尺度と検定の出発点となります。

PaperMindでテーマを探す近日公開Find papers & topics
Tools & resources
スライドをダウンロード
Learn & explore
動画近日公開

Definition

分割表とは、サンプルをセルのグリッドにクロス分類したものであり、そのエントリは、2つ以上のカテゴリカル変数の特定のカテゴリの組み合わせを共有する観測値の頻度です。2×2表は、2つの二値変数と4つのセルを持つ特殊なケースです。

Scope

この項目では、度数を分割表に配置する方法、2×2(四分割)表の構造と表記法、それが示す周辺分布と同時分布、行変数と列変数の独立性の概念、およびカイ二乗検定、厳密検定、効果量(effect measures)が計算される共通の基盤としての表の役割について説明します。これは、表を臨床的ガイダンスとしてではなく、方法論的な対象として扱います。

Core questions

  • 2つのカテゴリカル変数は、どのようにして度数のセルにクロス分類されますか?
  • 周辺合計と同時セル頻度とは何ですか、またそれらは独立性の下でどのように関連しますか?
  • なぜ2×2表は、二値の曝露と二値のアウトカムの典型的なレイアウトなのですか?
  • 行変数と列変数が独立している場合、セルにはどのような期待度数が含まれるでしょうか?

Key concepts

  • 行、列、およびセル
  • 周辺合計と総計
  • 同時分布と条件付き分布
  • 独立性と独立性の下での期待度数
  • 2×2(四分割)表のレイアウト a, b, c, d
  • 曝露とアウトカムのクロス集計

Mechanisms

各観測値は、そのカテゴリの組み合わせに従って正確に1つのセルに配置されるため、表は同時頻度分布を記録します。行または列にわたって合計すると周辺合計が得られ、セルを周辺合計で割ると条件付き分布が得られます。2つの変数が独立であるという仮説の下では、セルの期待度数は、その行と列の周辺合計を総計で割った積であり、観測度数と期待度数の間の不一致が関連性検定によって評価されます。2×2の場合、4つのセルは慣習的にa、b、c、d(曝露あり-症例あり、曝露あり-症例なし、曝露なし-症例あり、曝露なし-症例なし)とラベル付けされ、これら4つの数値から直接、リスク比、オッズ比、カイ二乗統計量が得られます。より大きなr×c表や多次元表も同じ論理を拡張したものであり、2×2表を第三の変数で層別化すると、マンテル・ヘンツェル解析で使用される層別表が作成されます。

Clinical relevance

2×2表は、診断精度、治療効果、リスク因子のデータが最も頻繁に提示される形式であるため、それを読み解くこと、つまりセル、周辺合計、そして何が比較されているのかを特定することは、健康に関するエビデンスを評価する上で基本となります。これはデータを整理し、読み取る方法であり、個々の診断や治療の決定の根拠となるものではありません。

Epidemiology

コホート研究、症例対照研究、横断研究、および二値エンドポイントを持つランダム化比較試験はすべて、その核心において、曝露または介入とアウトカムの2×2表に集約されます。診断テスト研究では、テスト結果と真の状態の2×2表を使用します。したがって、この表は疫学における研究デザイン全体で共通の計算上の出発点となります。

History

「分割表(contingency table)」という用語は、1900年頃のカール・ピアソンに由来し、フィッシャーの1922年の論文で、そのような表の分析方法と自由度(degrees of freedom)が明確にされました。四分割(2×2)表は20世紀の医療統計の主力となり、フレイスとアグレスティによる参考書は、その表記法と、それに基づいて構築された尺度と検定の体系を体系化しました。

Key figures

  • Karl Pearson
  • Ronald A. Fisher
  • Joseph Fleiss
  • Alan Agresti

Related topics

Seminal works

  • fisher-1922
  • fleiss-2003
  • agresti-2013

Frequently asked questions

2×2表とは何ですか?
これは最も単純な分割表です。二値の曝露(または介入)と二値のアウトカムをクロス分類する2つの行と2つの列からなり、リスク比、オッズ比、カイ二乗検定を計算するために使用される4つのセルが含まれます。
分割表における「独立性」とは何を意味しますか?
2つの変数は、一方の分布が他方に依存しない場合に独立していると言えます。独立性の下では、各セルの期待度数は、その行合計と列合計の積を総計で割ったものに等しく、関連性検定はこの逸脱を測定します。

Methods for this concept

Related concepts