它是最简单的列联表：两行两列交叉分类二元暴露（或干预）与二元结果，得到四个单元格，其计数用于计算风险比、优势比和卡方检验。

列联表中的“独立性”意味着什么？

当一个变量的分布不依赖于另一个变量时，这两个变量是独立的；在独立性下，每个单元格的期望计数等于其行总数乘以其列总数除以总计，关联检验衡量的是与此的偏差。

列联表与2×2表

列联表是一种矩形计数阵列，通过两个（或更多）分类变量对样本进行交叉分类，显示每个类别组合中有多少观测值。在健康研究中，其最简单和最重要的形式是2×2表，它将二元暴露与二元结果进行交叉制表，是几乎所有关联度量和检验的起点。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

下载幻灯片

Learn & explore

视频即将推出

Definition

列联表是对样本进行交叉分类，形成一个单元格网格，其中条目是共享两个或更多分类变量给定类别组合的观测值的频率；2×2表是具有两个二元变量和四个单元格的特殊情况。

Scope

本条目涵盖了如何将计数排列成列联表，2×2（四格）表的结构和符号，它所显示的边际分布和联合分布，行变量和列变量之间独立性的概念，以及该表作为计算卡方检验、精确检验和效应度量的共同基础的作用。它将该表视为一种方法学对象，而非临床指导。

Core questions

如何将两个分类变量交叉分类到计数单元格中？
边际总数和联合单元格频率是什么，它们在独立性下如何关联？
为什么2×2表是二元暴露和二元结果的规范布局？
如果行变量和列变量是独立的，单元格中会包含哪些期望计数？

Key concepts

行、列和单元格
边际总数和总计
联合分布和条件分布
独立性及独立性下的期望计数
2×2（四格）表布局a、b、c、d
暴露-结果交叉制表

Mechanisms

每个观测值根据其类别组合被放置在一个且仅一个单元格中，因此该表记录了联合频率分布；对行或列求和得到边际总数，将单元格除以边际得到条件分布。在两个变量独立的假设下，单元格中的期望计数是其行边际总数和列边际总数的乘积除以总计，关联检验评估的是观测计数与期望计数之间的差异。在2×2表中，四个单元格通常标记为a、b、c、d（暴露-病例、暴露-非病例、未暴露-病例、未暴露-非病例），这四个数字直接得出风险比、优势比和卡方统计量。更大的r×c表和多维表扩展了相同的逻辑，通过第三个变量对2×2表进行分层会产生Mantel-Haenszel分析中使用的分层表。

Clinical relevance

2×2表是诊断准确性、治疗效果和风险因素数据最常呈现的形式，因此能够阅读它——识别单元格、边际以及正在比较的内容——是评估健康证据的基础。它是一种组织和阅读数据的方式，本身不是个体诊断或治疗决策的基础。

Epidemiology

队列研究、病例对照研究、横断面研究以及具有二元终点的随机试验，其核心都归结为暴露或干预与结果的2×2表；诊断试验研究使用测试结果与真实状态的2×2表。因此，该表是流行病学中各种研究设计共同的计算起点。

History

“列联表”一词可追溯到1900年左右的Karl Pearson，Fisher在1922年的论文阐明了如何分析此类表以及涉及的自由度。四格（2×2）表成为20世纪医学统计学的主力，Fleiss和Agresti的参考文本规范了其符号以及基于它的一系列度量和检验。

Key figures

Karl Pearson
Ronald A. Fisher
Joseph Fleiss
Alan Agresti

Seminal works

fisher-1922
fleiss-2003
agresti-2013

Frequently asked questions

什么是2×2表？: 它是最简单的列联表：两行两列交叉分类二元暴露（或干预）与二元结果，得到四个单元格，其计数用于计算风险比、优势比和卡方检验。
列联表中的“独立性”意味着什么？: 当一个变量的分布不依赖于另一个变量时，这两个变量是独立的；在独立性下，每个单元格的期望计数等于其行总数乘以其列总数除以总计，关联检验衡量的是与此的偏差。