荟萃分析
荟萃分析是一种统计学方法,它将针对同一问题的多项研究的效应估计值结合起来,形成一个单一的、更精确的汇总估计值。通过根据每项研究的精确度赋予其权重,荟萃分析得出了任何单一研究都无法提供的总体答案,并报告了其周围的剩余不确定性。
Definition
荟萃分析是将多项研究的效应估计值进行定量组合,形成一个加权汇总估计值,通常在固定效应模型(假设存在一个共同效应)或随机效应模型(假设效应在研究间存在差异)下使用逆方差加权。
Scope
本条目涵盖了汇总的核心机制:如何对个体研究效应进行加权,固定效应模型和随机效应模型之间的区别,以及如何解读汇总估计值及其区间。它将荟萃分析视为证据综合中的一种定量方法,是一种参考性描述而非临床指导。更广泛的系统评价过程在系统评价下的相关荟萃分析节点中有所涵盖。
Core questions
- 当个体研究结果合并时,如何对其进行加权?
- 在固定效应模型和随机效应模型下,汇总估计值分别代表什么?
- 如何解释汇总估计值周围的置信区间?
- 何时适合对研究进行汇总?
Key concepts
- 逆方差加权
- 固定效应模型
- 随机效应模型
- 汇总(总结)效应
- 置信区间和预测区间
- 森林图
Mechanisms
每项研究都提供一个效应估计值(例如风险比、优势比或均值差)及其标准误。在逆方差加权中,更精确的研究获得更大的权重,加权平均值即为汇总估计值。在固定效应模型下,所有研究被假定共享一个真实效应,因此权重仅取决于研究内方差。在随机效应模型下,真实效应被假定存在差异,因此估计的研究间方差被添加到每个权重中,从而缩小了最大研究的影响并扩大了置信区间。DerSimonian-Laird 方法提供了基于矩的经典估计量来估计该研究间方差;Riley 及其同事强调,随机效应汇总是一个平均效应,其解释及其周围的预测区间必须反映效应在不同背景下存在差异。
Clinical relevance
荟萃分析的汇总估计值通常位于证据等级的顶端,并直接用于指导方针和卫生技术评估,因此能够解读森林图并理解其汇总线的含义是证据评估的一部分。本条目解释了汇总估计值是如何产生的,并非个体治疗决策的依据。
Evidence & guidelines
荟萃分析的实施和透明报告遵循 Cochrane 手册(Higgins & Green, 2008)和 PRISMA 声明(Moher et al., 2009),这些规范详细说明了汇总估计值、模型选择和周围不确定性应如何呈现。
History
荟萃分析一词由 Gene Glass 于 1976 年引入,用于研究结果的定量综合。其在临床研究中的应用以 DerSimonian 和 Laird 于 1986 年提出的随机效应框架为基础,后来的阐述,如 Borenstein 及其同事(2010)澄清了固定效应和随机效应汇总之间的概念差异,这些差异至今仍在指导实践。
Debates
- 随机效应汇总估计值到底意味着什么?
- 由于随机效应模型对真实效应的分布进行平均,其汇总线是一个平均值而非单一的共同值;Riley 及其同事认为,需要预测区间而不仅仅是置信区间来传达效应在不同背景下的范围。
Key figures
- Rebecca DerSimonian
- Nan Laird
- Michael Borenstein
- Larry Hedges
- Julian Higgins
- Richard Riley
Related topics
Seminal works
- dersimonian-laird-1986
- borenstein-2010
- higgins-handbook-2008
Frequently asked questions
- 固定效应荟萃分析和随机效应荟萃分析有什么区别?
- 固定效应分析假设每项研究都估计相同的单一真实效应,而随机效应分析假设真实效应在研究间存在差异,并增加了研究间方差项,这通常会扩大置信区间。
- 任何一组研究都可以进行荟萃分析吗?
- 不可以。只有当研究在问题、人群和结果方面足够相似时,汇总才有意义;当它们过于多样化时,合并它们可能会产生精确但具有误导性的汇总结果。