분할표 및 2×2표
분할표는 두 개(또는 그 이상)의 범주형 변수에 따라 표본을 교차 분류하는 직사각형 형태의 빈도표로, 각 범주 조합에 속하는 관측치의 수를 보여줍니다. 건강 연구에서 가장 단순하고 중요한 형태는 2×2표로, 이분형 노출과 이분형 결과를 교차 집계하며, 거의 모든 연관성 측정 및 검정의 출발점입니다.
Definition
분할표는 두 개 이상의 범주형 변수의 주어진 범주 조합을 공유하는 관측치의 빈도가 셀에 입력되는 격자로 표본을 교차 분류한 것입니다. 2×2표는 두 개의 이분형 변수와 네 개의 셀을 가진 특수한 경우입니다.
Scope
이 항목은 빈도가 분할표에 어떻게 배열되는지, 2×2(사분할)표의 구조와 표기법, 이 표가 나타내는 주변 분포와 결합 분포, 행 변수와 열 변수 간의 독립성 개념, 그리고 카이제곱 검정, 정확 검정 및 효과 측정이 계산되는 공통적인 기반으로서의 표의 역할에 대해 다룹니다. 이 항목은 표를 방법론적 대상으로 다루며, 임상적 지침으로 다루지 않습니다.
Core questions
- 두 개의 범주형 변수는 어떻게 빈도 셀로 교차 분류됩니까?
- 주변 합계와 결합 셀 빈도는 무엇이며, 독립성 하에서 이들은 어떻게 관련됩니까?
- 2×2표가 이분형 노출과 이분형 결과에 대한 정식 배치인 이유는 무엇입니까?
- 행 변수와 열 변수가 독립적이라면 셀에는 어떤 기대 빈도가 포함될까요?
Key concepts
- 행, 열, 셀
- 주변 합계 및 총합
- 결합 및 조건부 분포
- 독립성 및 독립성 하의 기대 빈도
- 2×2(사분할)표 배치 a, b, c, d
- 노출-결과 교차 집계
Mechanisms
각 관측치는 범주 조합에 따라 정확히 하나의 셀에 배치되므로, 표는 결합 빈도 분포를 기록합니다. 행 또는 열을 따라 합산하면 주변 합계가 산출되며, 셀을 주변 합계로 나누면 조건부 분포가 얻어집니다. 두 변수가 독립이라는 가설 하에, 한 셀의 기대 빈도는 해당 행의 주변 합계와 열의 주변 합계를 곱한 후 총합으로 나눈 값이며, 관측된 빈도와 기대 빈도 간의 불일치는 연관성 검정이 평가하는 대상입니다. 2×2표의 경우 네 개의 셀은 관례적으로 a, b, c, d (노출-환자, 노출-비환자, 비노출-환자, 비노출-비환자)로 표기되며, 이 네 가지 숫자는 위험비, 오즈비, 카이제곱 통계량을 직접적으로 산출합니다. 더 큰 r×c표와 다차원표는 동일한 논리를 확장하며, 2×2표를 세 번째 변수로 층화하면 Mantel-Haenszel 분석에 사용되는 층화된 표가 생성됩니다.
Clinical relevance
2×2표는 진단 정확도, 치료 효과, 위험 요인 데이터가 가장 자주 제시되는 형식입니다. 따라서 2×2표를 읽는 능력, 즉 셀, 주변 합계, 그리고 무엇이 비교되는지를 식별하는 능력은 건강 증거를 평가하는 데 필수적입니다. 이는 데이터를 구성하고 읽는 방법이며, 개별적인 진단 또는 치료 결정의 근거 자체는 아닙니다.
Epidemiology
코호트 연구, 환자-대조군 연구, 단면 연구, 그리고 이분형 결과변수를 가진 무작위 대조군 연구는 모두 그 핵심에서 노출 또는 중재와 결과 간의 2×2표로 요약됩니다. 진단 검사 연구는 검사 결과와 실제 상태 간의 2×2표를 사용합니다. 따라서 이 표는 역학 연구 설계 전반에 걸쳐 공유되는 계산의 출발점입니다.
History
“분할표(contingency table)”라는 용어는 1900년경 Karl Pearson에게서 유래했으며, Fisher의 1922년 논문은 이러한 표가 어떻게 분석되고 관련된 자유도가 무엇인지 명확히 했습니다. 사분할(2×2)표는 20세기 의학 통계의 핵심 도구가 되었고, Fleiss와 Agresti의 참고 문헌들은 그 표기법과 이를 기반으로 하는 측정 및 검정의 계열을 체계화했습니다.
Key figures
- Karl Pearson
- Ronald A. Fisher
- Joseph Fleiss
- Alan Agresti
Related topics
Seminal works
- fisher-1922
- fleiss-2003
- agresti-2013
Frequently asked questions
- 2×2표는 무엇입니까?
- 이는 가장 단순한 분할표입니다. 이분형 노출(또는 중재)과 이분형 결과를 교차 분류하는 두 개의 행과 두 개의 열로 구성되며, 위험비, 오즈비, 카이제곱 검정을 계산하는 데 사용되는 네 개의 셀 빈도를 제공합니다.
- 분할표에서 “독립성”은 무엇을 의미합니까?
- 두 변수는 한 변수의 분포가 다른 변수에 의존하지 않을 때 독립적입니다. 독립성 하에서 각 셀의 기대 빈도는 해당 행의 총합에 열의 총합을 곱한 후 총합으로 나눈 값과 같으며, 연관성 검정은 이로부터의 편차를 측정합니다.