系统评价和荟萃分析有什么区别？

系统评价使用明确、可重复的方法来查找、评估和总结研究；荟萃分析是某些评价中可选的统计步骤，当研究足够相似时，它将研究结果汇总为单一的加权估计值。

如果一项研究已经发表，为什么还需要批判性评估？

发表不保证有效性；评估旨在评估偏倚风险、效应的精确度和大小，以及研究结果是否适用于特定患者，从而根据其可信度来权衡结论。

证据综合与批判性评估

证据综合是通过系统地定位、选择和整合初级研究结果，形成连贯总结的过程，最严谨的方式是通过系统评价，并在适当时进行荟萃分析。批判性评估是对研究或评价的有效性、结果和适用性进行结构化评估。两者结合起来，使物理治疗师能够判断现有证据的可靠程度及其对患者的适用性。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

下载幻灯片

Learn & explore

视频即将推出

Definition

证据综合是对相关研究进行系统识别、评估和整合，以形成现有知识的总体总结；批判性评估是对研究结果的有效性、效应量、精确性和适用性进行明确、结构化的评价。

Scope

本条目涵盖了系统评价和荟萃分析作为综合方法，PRISMA等报告标准，评估研究质量和偏倚风险的工具，以及GRADE等评估证据确定性的框架。这是一个关于如何总结和判断证据的方法学主题，而不是临床建议或治疗意见的来源。

Core questions

系统评价和荟萃分析是如何进行和报告的？
如何评估研究或评价中的偏倚风险？
如何评估整体证据体系的确定性？
临床医生如何判断证据是否适用于特定患者？

Key concepts

系统评价
荟萃分析和汇总效应估计
偏倚风险和研究质量
PRISMA报告标准
PEDro试验评估量表
GRADE证据确定性
异质性
发表偏倚
适用性和外部效度

Key theories

系统评价和荟萃分析: 一种方法，它使用预先指定的方案、全面的搜索、明确的选择和偏倚风险评估，以及——在研究足够相似的情况下——统计汇总，以产生透明、可重复的证据综合。
GRADE证据确定性框架: 一种结构化方法，通过考虑偏倚风险、不一致性、间接性、不精确性和发表偏倚，评估每个结局的证据体系的确定性（从高到极低），并将确定性与任何建议的强度分开。

Mechanisms

系统评价始于一个聚焦的问题和方案，进行全面的搜索，根据明确的标准筛选研究，并评估每项研究的偏倚风险；PRISMA声明规定了每个步骤应报告的内容，以确保过程的透明性和可重复性。当纳入的研究足够相似时，荟萃分析将它们的效应估计值汇集为加权汇总，并进行异质性的统计评估。对个体研究的批判性评估使用结构化工具——在物理治疗领域，PEDro量表评估随机试验的方法学质量——然后GRADE框架评估每个结局的综合证据的确定性。适用性是单独判断的：即使是有效的证据，也必须符合患者的特征和背景才能为决策提供信息。

Clinical relevance

综合和评估使物理治疗师能够权衡相互竞争的主张，避免被单一研究或有偏倚的报告误导，从而支持循证实践中的研究证据要素。本条目描述了如何总结和判断证据；它具有教育意义，本身不推荐或评估任何针对患者的具体干预措施。

Evidence & guidelines

系统评价的报告受PRISMA声明的约束，该声明最初于2009年发布，并更新为PRISMA 2020（Page及其同事）；而证据的确定性则广泛采用GRADE（Guyatt及其同事，2008）进行评估。在物理治疗领域，PEDro量表（Maher及其同事，2003）是评估随机对照试验质量的标准工具，PEDro数据库收录了经过评估的试验和评价。

History

荟萃分析和系统评价在20世纪后期发展起来，并由Cochrane协作组织自1993年起制度化。报告标准随之出现：QUOROM，随后是2009年的PRISMA，并于2020年更新。GRADE工作组在21世纪初将确定性评估正式化，物理治疗领域也贡献了特定领域的工具，如PEDro量表和数据库，以使康复试验的评估系统化。

Debates

何时应在荟萃分析中汇总研究？: 合并异质性研究可能会产生精确但具有误导性的总结；决定何时临床和统计异质性会阻止汇总，以及如何处理它，仍然是一个核心的方法学判断。
证据的确定性应如何与建议的强度区分开来？: GRADE有意将证据的确定性与建议的强度分开，因为价值观、偏好和权衡也影响建议；持续应用这种区分是一个持续的挑战。

Key figures

David Moher
Matthew Page
Gordon Guyatt
Christopher Maher
David Sackett

Seminal works

moher-2009
page-2021
guyatt-2008-grade

Frequently asked questions

系统评价和荟萃分析有什么区别？: 系统评价使用明确、可重复的方法来查找、评估和总结研究；荟萃分析是某些评价中可选的统计步骤，当研究足够相似时，它将研究结果汇总为单一的加权估计值。
如果一项研究已经发表，为什么还需要批判性评估？: 发表不保证有效性；评估旨在评估偏倚风险、效应的精确度和大小，以及研究结果是否适用于特定患者，从而根据其可信度来权衡结论。