ScholarGate
助手

混杂

混杂是效应的混合:暴露与结局之间看似存在的关联被扭曲了,因为第三个因素——混杂因素——是两者的共同原因。除非加以控制,混杂可能使无害的暴露看起来有害,掩盖真实效应,或夸大某一效应。控制混杂是观察性流行病学中的核心任务之一。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

混杂是指当第三个变量是暴露和结局的共同原因(且不在两者之间的因果路径上)时,暴露-结局关联发生的扭曲,从而使粗略关联混合了暴露的效应和该变量的效应。

Scope

本条目涵盖了哪些变量构成混杂因素,如何使用因果推理和有向无环图识别混杂,以及通过设计和分析控制混杂的主要策略。它还将混杂与效应修饰和中介区分开来。这是一份方法学参考,而非临床指导。

Core questions

  • 候选变量是否是暴露和结局的共同原因?
  • 该变量是在因果路径上(中介变量)还是混杂因素?
  • 需要调整哪些变量才能消除混杂?
  • 残余或未测量的混杂是否仍能解释这种关联?

Key concepts

  • 共同原因
  • 混杂因素
  • 有向无环图 (DAG)
  • 可交换性
  • 后门路径
  • 调整、分层和匹配
  • 残余和未测量混杂
  • 混杂与中介

Mechanisms

从潜在结局的视角来看,混杂是可交换性(exchangeability)的失败:暴露组和未暴露组在结局的背景风险上存在差异,这些差异并非由暴露引起。在因果图术语中,混杂因素通过共同原因在暴露和结局之间打开了一条非因果的“后门”路径;通过对一组适当的变量进行条件化来阻断该路径,即可消除混杂。位于因果路径上的变量(中介变量)不是混杂因素,对其进行调整可能会引入其自身的偏差。控制可以通过设计(随机化、限制、匹配)或分析(分层、标准化、回归调整以及倾向得分等方法)来实现。由于调整只能处理已测量的混杂因素,未测量和残余混杂仍然是观察性估计的局限性。

Clinical relevance

混杂是观察性关联并非自动具有因果关系的主要原因,判断一项研究如何处理混杂对于评估暴露与疾病的证据至关重要。这个概念解释了证据是如何被解读的;它本身并非针对任何个体的诊断或治疗建议。

Epidemiology

对混杂的关注贯穿于队列研究、病例对照研究和横断面研究等观察性研究中。它促使了随机对照试验(平均而言,随机对照试验平衡了已测量和未测量的混杂因素)以及越来越多地使用明确的因果图和定量偏差分析来推断需要调整的因素。

History

对第三个因素可能混合效应的认识由来已久,但精确的定义出现在20世纪末。Greenland和Robins(1986)通过可交换性和研究试图近似的反事实比较来构建混杂,而Greenland、Pearl和Robins(1999)的因果图框架为识别混杂因素和选择调整集提供了图形标准。这些发展将混杂与效应修饰和选择偏倚清晰地分离开来。

Debates

应如何选择混杂因素进行调整?
过去的实践倾向于依赖统计标准(例如,估计值变化或关联的显著性),而因果图方法则认为,调整集应根据先验的因果结构主题知识来选择,以避免对中介变量或对撞子进行调整。

Key figures

  • Sander Greenland
  • James Robins
  • Judea Pearl
  • Olli Miettinen

Related topics

Seminal works

  • greenland-robins-1986
  • greenland-pearl-robins-1999
  • maldonado-greenland-2002

Frequently asked questions

混杂因素和中介因素有什么区别?
混杂因素是暴露和结局的共同原因,且不在因果路径上;中介因素位于从暴露到结局的路径上。调整混杂因素可以减少偏差,但调整中介因素可能会引入偏差。
随机化能消除混杂吗?
随机化平均而言,尤其是在大型试验中,倾向于平衡各组之间已测量和未测量的共同原因,这就是为什么它能以观察性数据调整无法完全匹配的方式控制混杂。
混杂与效应修饰相同吗?
不。混杂是一种需要消除的扭曲;效应修饰是效应在不同亚组之间真实存在的变异,是关系本身的属性,而非错误。

Methods for this concept

Related concepts