内部有效性和外部有效性有什么区别？

内部有效性是指研究结果是否无偏倚，并反映其样本中的真实效应；外部有效性是指该结果是否适用于其他患者、环境或问题。

证据等级越高是否保证答案越好？

不是。研究设计决定了证据的潜在强度，但一项执行不佳的试验或评价仍然可能存在偏倚，这就是为什么对每项研究都进行结构化的偏倚风险评估和确定性分级。

证据评估与批判性评价

证据评估与批判性评价是对一项研究或一系列证据是否有效、其结果意味着什么以及它们是否适用于特定问题的严谨判断。它是循证医学的核心分析技能，将证据的可靠性与其主张的响度区分开来。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

下载幻灯片

Learn & explore

视频即将推出

Definition

批判性评价是系统地审查研究以判断其内部有效性（无偏倚）、结果的大小和精确度及其外部有效性（适用性）的过程，以便在使用证据之前确定其可信度。

Scope

本主题涵盖证据等级、对个体研究中偏倚风险的结构化评估、对一系列证据确定性的分级以及适用性判断。它是一个关于如何判断证据的方法论和参考主题，而非治疗指导的来源。

Core questions

研究的设计和实施是否没有重要的偏倚？
报告效应的大小和精确度如何？
总体证据体系的确定性如何？
结果是否适用于当前的患者或问题？

Key concepts

内部有效性和偏倚风险
外部有效性和适用性
证据等级
证据的确定性（质量）
效应大小和精确度
结构化评价工具（RoB 2, AMSTAR 2）

Mechanisms

评价从个体研究到证据体系逐步进行。对于随机试验，RoB 2等结构化工具检查可能引入偏倚的领域——随机化、与预期干预的偏离、缺失数据、测量和选择性报告。对于系统评价，AMSTAR 2评估方法学质量。在各项研究中，GRADE框架将证据体系的确定性评级为高、中、低或极低，因偏倚风险、不一致性、间接性、不精确性和发表偏倚而降低，并因大效应等特征而提高。这种确定性评级随后促使从证据到建议的转变。所有这些的基础是循证医学原则，即外部证据在与临床专业知识整合之前必须经过评价。

Clinical relevance

批判性评价决定了一项证据在处方集决策、指南制定和回答药物信息问题中应有多大权重。它是衡量医学文献的参考技能，描述了如何判断证据；它本身不直接指导个体诊断或治疗。

Evidence & guidelines

有几种广泛采用的工具使评价标准化：用于随机试验偏倚风险的Cochrane RoB 2工具、用于系统评价方法学质量的AMSTAR 2以及用于评估证据体系确定性和建议强度的GRADE框架。这些工具由其开发团队维护，并随着方法的发展而更新。

History

批判性评价由20世纪80年代和90年代的临床流行病学和循证医学运动正式确立，Sackett及其同事阐明了其原则。随后出现了结构化工具：Cochrane偏倚风险工具（修订为RoB 2）、AMSTAR系统评价质量工具（修订为AMSTAR 2）以及GRADE确定性分级方法，它们共同用明确、可重现的标准取代了非正式判断。

Key figures

David Sackett
Gordon Guyatt
Jonathan Sterne
Beverley Shea

Seminal works

sackett-1996
guyatt-2008-grade
sterne-2019-rob2
shea-2017-amstar2

Frequently asked questions

内部有效性和外部有效性有什么区别？: 内部有效性是指研究结果是否无偏倚，并反映其样本中的真实效应；外部有效性是指该结果是否适用于其他患者、环境或问题。
证据等级越高是否保证答案越好？: 不是。研究设计决定了证据的潜在强度，但一项执行不佳的试验或评价仍然可能存在偏倚，这就是为什么对每项研究都进行结构化的偏倚风险评估和确定性分级。