证据确定性与偏倚风险相同吗？

不。偏倚风险是单个研究的属性，而证据确定性是对某一结局的证据体系的总体判断；偏倚风险是可能降低确定性的几个因素之一。

“高确定性”究竟意味着什么？

这意味着我们非常有信心真实效应与估计值接近，因此进一步的研究不太可能改变该结局的结论；较低的类别则表明不确定性逐渐增大。

证据确定性评级

证据确定性评级是对估计效应与特定结局的真实效应接近程度的信心判断。它是整个证据体系的属性，而非单一研究的属性。在GRADE框架中，经过对现有研究的局限性和优势的综合考量，它被分为四个类别：高、中、低和极低。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

下载幻灯片

Learn & explore

视频即将推出

Definition

证据确定性是对可以多大程度上确信某一结局的真实效应与从证据体系中得出的估计值接近的等级评估——分为高、中、低或极低。

Scope

本条目涵盖了确定性（有时也称为证据质量或信心）的含义、四个类别、降低或提高确定性的因素，以及如何进行总结。它是一个方法学参考，与偏倚风险（单一研究的属性）和推荐强度不同。

Key concepts

确定性是证据体系的属性，而非单一研究的属性
四个类别：高、中、低、极低
针对特定结局的评级
降级因素：偏倚风险、不一致性、间接性、不精确性、发表偏倚
观察性证据的升级因素：大效应、剂量-反应、与效应相反的合理混杂
结果总结表
与推荐强度的区别

Mechanisms

确定性评级始于GRADE中基于研究设计的起点——随机对照试验为高，观察性研究为低——然后根据五个领域进行降级：研究间的偏倚风险、结果的不一致性、证据与问题的间接性、汇总估计的不精确性以及可疑的发表偏倚。当效应较大、存在剂量-反应梯度，或当合理的残余混杂因素会降低而非产生观察到的效应时，观察性证据的确定性可能会被评级上调。综合判断为每个重要结局得出四个确定性级别之一，通常显示在“结果总结表”中；它回答的是“我们对这个估计值有多大信任度？”，这与“推荐强度如何？”是分开的。

Clinical relevance

确定性评级告诉指南和综述的读者，一个结论可以承受多大的分量：高确定性的发现不太可能因进一步研究而改变，而极低确定性则表明真实效应非常不确定。这传达了证据的可信度并描述了评估方法；它本身并非针对个体护理的指令。

Evidence & guidelines

四级确定性结构以及上调或下调的规则在GRADE共识（Guyatt et al., 2008）中提出，并在GRADE指南系列中详细阐述，包括引言和结果总结表（Guyatt et al., 2011）、评级质量的总体逻辑（Balshem et al., 2011）以及研究局限性领域（Guyatt et al., 2011）。确定性评级现在已成为Cochrane综述和许多临床指南的标准。

History

在GRADE之前，“证据质量”通常等同于研究设计或单一研究的质量评分。从2004年起，GRADE将其重新定义为关于证据体系的、针对特定结局的确定性，2011年的指南系列详细说明了每个领域如何提高或降低确定性。术语随着时间从“证据质量”转向“证据确定性”，以强调评级关注的是对估计值的信心，而不仅仅是方法学质量。

Debates

四级量表是否过于粗略？: 将连续的信心概念归纳为四个标签有助于沟通，但可能隐藏临界判断和降级背后的推理；GRADE通过要求对每个评级决策提供明确、有记录的理由来解决这个问题。

Key figures

Gordon Guyatt
Howard Balshem
Holger Schunemann
Andrew Oxman

Seminal works

guyatt-2008-grade
balshem-2011
guyatt-2011-intro

Frequently asked questions

证据确定性与偏倚风险相同吗？: 不。偏倚风险是单个研究的属性，而证据确定性是对某一结局的证据体系的总体判断；偏倚风险是可能降低确定性的几个因素之一。
“高确定性”究竟意味着什么？: 这意味着我们非常有信心真实效应与估计值接近，因此进一步的研究不太可能改变该结局的结论；较低的类别则表明不确定性逐渐增大。