ScholarGate
助手

列联表与2×2表

列联表是一种矩形计数阵列,通过两个(或更多)分类变量对样本进行交叉分类,显示每个类别组合中有多少观测值。在健康研究中,其最简单和最重要的形式是2×2表,它将二元暴露与二元结果进行交叉制表,是几乎所有关联度量和检验的起点。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

列联表是对样本进行交叉分类,形成一个单元格网格,其中条目是共享两个或更多分类变量给定类别组合的观测值的频率;2×2表是具有两个二元变量和四个单元格的特殊情况。

Scope

本条目涵盖了如何将计数排列成列联表,2×2(四格)表的结构和符号,它所显示的边际分布和联合分布,行变量和列变量之间独立性的概念,以及该表作为计算卡方检验、精确检验和效应度量的共同基础的作用。它将该表视为一种方法学对象,而非临床指导。

Core questions

  • 如何将两个分类变量交叉分类到计数单元格中?
  • 边际总数和联合单元格频率是什么,它们在独立性下如何关联?
  • 为什么2×2表是二元暴露和二元结果的规范布局?
  • 如果行变量和列变量是独立的,单元格中会包含哪些期望计数?

Key concepts

  • 行、列和单元格
  • 边际总数和总计
  • 联合分布和条件分布
  • 独立性及独立性下的期望计数
  • 2×2(四格)表布局a、b、c、d
  • 暴露-结果交叉制表

Mechanisms

每个观测值根据其类别组合被放置在一个且仅一个单元格中,因此该表记录了联合频率分布;对行或列求和得到边际总数,将单元格除以边际得到条件分布。在两个变量独立的假设下,单元格中的期望计数是其行边际总数和列边际总数的乘积除以总计,关联检验评估的是观测计数与期望计数之间的差异。在2×2表中,四个单元格通常标记为a、b、c、d(暴露-病例、暴露-非病例、未暴露-病例、未暴露-非病例),这四个数字直接得出风险比、优势比和卡方统计量。更大的r×c表和多维表扩展了相同的逻辑,通过第三个变量对2×2表进行分层会产生Mantel-Haenszel分析中使用的分层表。

Clinical relevance

2×2表是诊断准确性、治疗效果和风险因素数据最常呈现的形式,因此能够阅读它——识别单元格、边际以及正在比较的内容——是评估健康证据的基础。它是一种组织和阅读数据的方式,本身不是个体诊断或治疗决策的基础。

Epidemiology

队列研究、病例对照研究、横断面研究以及具有二元终点的随机试验,其核心都归结为暴露或干预与结果的2×2表;诊断试验研究使用测试结果与真实状态的2×2表。因此,该表是流行病学中各种研究设计共同的计算起点。

History

“列联表”一词可追溯到1900年左右的Karl Pearson,Fisher在1922年的论文阐明了如何分析此类表以及涉及的自由度。四格(2×2)表成为20世纪医学统计学的主力,Fleiss和Agresti的参考文本规范了其符号以及基于它的一系列度量和检验。

Key figures

  • Karl Pearson
  • Ronald A. Fisher
  • Joseph Fleiss
  • Alan Agresti

Related topics

Seminal works

  • fisher-1922
  • fleiss-2003
  • agresti-2013

Frequently asked questions

什么是2×2表?
它是最简单的列联表:两行两列交叉分类二元暴露(或干预)与二元结果,得到四个单元格,其计数用于计算风险比、优势比和卡方检验。
列联表中的“独立性”意味着什么?
当一个变量的分布不依赖于另一个变量时,这两个变量是独立的;在独立性下,每个单元格的期望计数等于其行总数乘以其列总数除以总计,关联检验衡量的是与此的偏差。

Methods for this concept

Related concepts