因果推断
因果推断是流行病学和生物统计学的一个分支,旨在判断暴露与结果之间观察到的关联是反映了真正的因果关系,还是偶然、偏倚或混杂因素所致。它提供了概念框架、图形工具和分析方法,使研究人员能够精确地提出因果问题,并判断现有数据是否能回答这些问题。
Definition
因果推断是一套形式化的框架和方法,用于定义因果效应,阐明可以从数据中估计因果效应的假设,并评估所得结论对违反这些假设的稳健性。
Scope
本领域汇集了健康研究中现代因果推理的核心机制:因果标准和因果理论、用于编码假设的有向无环图、将因果估计量与可估计量联系起来的识别条件、针对未测量偏倚的敏感性分析,以及支撑所有这些的反事实(潜在结果)框架。它是一个方法学参考,而非临床指导。
Sub-topics
Core questions
- 统计关联何时支持因果结论?
- 从观察数据中识别因果效应需要哪些假设?
- 如何明确并检验这些假设?
- 因果结论对未测量混杂或其他偏倚的敏感性如何?
Key concepts
- 反事实与潜在结果
- 混杂与可交换性
- 有向无环图
- 识别与估计量
- 敏感性分析
- 希尔的因果关系观点
Mechanisms
现代因果推断建立在Rubin(rubin-1974)形式化的潜在结果(反事实)模型之上,其中因果效应是同一单位在不同、互斥暴露下可能发生的结果之间的对比。有向无环图(greenland-pearl-robins-1999)将关于变量如何关联的实质性假设转化为一个图,其结构决定了哪些调整可以阻断混杂,哪些会引入偏倚。识别问题在于,在可交换性、阳性性和一致性等既定假设下,反事实对比是否等于观测数据的一个函数(hernan-robins-2006)。如果无法保证假设,敏感性分析会量化未测量偏倚需要多强才能推翻研究结果。
Clinical relevance
因果推断框架塑造了关于治疗、暴露和风险因素的观察性证据的产生和评估方式;理解这些框架有助于读者判断报告的效应是否可信。本领域描述了证据是如何推理的,并非个体诊断或治疗建议的来源。
Epidemiology
因果推断方法现已成为观察性流行病学、药物流行病学和比较有效性研究的标准方法,在这些领域中,随机化通常是不可能的,研究人员必须提出并捍卫明确的假设。多元论传统强调,没有单一的方法或标准能够独立解决因果关系问题(vandenbroucke-2016)。
History
20世纪的流行病学从非正式的关联与因果关系争论(在Hill的1965年观点中得以明确,hill-1965)转向了明确的因果关系数学理论。Rubin的1974年潜在结果公式(rubin-1974)以及随后Greenland、Pearl和Robins(greenland-pearl-robins-1999)对因果图的发展,将反事实推理与图形模型统一起来,到21世纪初,这些工具已成为流行病学家构建和回答因果问题的核心(hernan-robins-2006)。
Debates
- 是否存在单一正确的因果推断框架?
- 一些人认为,带有图形方法的反事实模型提供了一个统一的基础,而另一些人则主张多元论观点,认为不同的标准和方法相互补充,没有单一规则可以解决因果关系问题。
Key figures
- Austin Bradford Hill
- Jerome Cornfield
- Donald Rubin
- James Robins
- Sander Greenland
- Judea Pearl
- Miguel Hernán
Related topics
Seminal works
- hill-1965
- rubin-1974
- greenland-pearl-robins-1999
- hernan-robins-2006
Frequently asked questions
- 因果推断与普通统计关联有何不同?
- 关联描述了数据中变量如何共同变化;因果推断增加了关于数据如何产生的明确假设,以便将关联解释为改变一个变量对另一个变量的影响。
- 在没有随机试验的情况下能否估计因果效应?
- 可以,但仅限于在既定且通常无法检验的假设下,例如没有未测量混杂;因果推断方法使这些假设明确化,并让研究人员检验结论对这些假设的稳健性。