证据综合与批判性评估
证据综合是通过系统地定位、选择和整合初级研究结果,形成连贯总结的过程,最严谨的方式是通过系统评价,并在适当时进行荟萃分析。批判性评估是对研究或评价的有效性、结果和适用性进行结构化评估。两者结合起来,使物理治疗师能够判断现有证据的可靠程度及其对患者的适用性。
Definition
证据综合是对相关研究进行系统识别、评估和整合,以形成现有知识的总体总结;批判性评估是对研究结果的有效性、效应量、精确性和适用性进行明确、结构化的评价。
Scope
本条目涵盖了系统评价和荟萃分析作为综合方法,PRISMA等报告标准,评估研究质量和偏倚风险的工具,以及GRADE等评估证据确定性的框架。这是一个关于如何总结和判断证据的方法学主题,而不是临床建议或治疗意见的来源。
Core questions
- 系统评价和荟萃分析是如何进行和报告的?
- 如何评估研究或评价中的偏倚风险?
- 如何评估整体证据体系的确定性?
- 临床医生如何判断证据是否适用于特定患者?
Key concepts
- 系统评价
- 荟萃分析和汇总效应估计
- 偏倚风险和研究质量
- PRISMA报告标准
- PEDro试验评估量表
- GRADE证据确定性
- 异质性
- 发表偏倚
- 适用性和外部效度
Key theories
- 系统评价和荟萃分析
- 一种方法,它使用预先指定的方案、全面的搜索、明确的选择和偏倚风险评估,以及——在研究足够相似的情况下——统计汇总,以产生透明、可重复的证据综合。
- GRADE证据确定性框架
- 一种结构化方法,通过考虑偏倚风险、不一致性、间接性、不精确性和发表偏倚,评估每个结局的证据体系的确定性(从高到极低),并将确定性与任何建议的强度分开。
Mechanisms
系统评价始于一个聚焦的问题和方案,进行全面的搜索,根据明确的标准筛选研究,并评估每项研究的偏倚风险;PRISMA声明规定了每个步骤应报告的内容,以确保过程的透明性和可重复性。当纳入的研究足够相似时,荟萃分析将它们的效应估计值汇集为加权汇总,并进行异质性的统计评估。对个体研究的批判性评估使用结构化工具——在物理治疗领域,PEDro量表评估随机试验的方法学质量——然后GRADE框架评估每个结局的综合证据的确定性。适用性是单独判断的:即使是有效的证据,也必须符合患者的特征和背景才能为决策提供信息。
Clinical relevance
综合和评估使物理治疗师能够权衡相互竞争的主张,避免被单一研究或有偏倚的报告误导,从而支持循证实践中的研究证据要素。本条目描述了如何总结和判断证据;它具有教育意义,本身不推荐或评估任何针对患者的具体干预措施。
Evidence & guidelines
系统评价的报告受PRISMA声明的约束,该声明最初于2009年发布,并更新为PRISMA 2020(Page及其同事);而证据的确定性则广泛采用GRADE(Guyatt及其同事,2008)进行评估。在物理治疗领域,PEDro量表(Maher及其同事,2003)是评估随机对照试验质量的标准工具,PEDro数据库收录了经过评估的试验和评价。
History
荟萃分析和系统评价在20世纪后期发展起来,并由Cochrane协作组织自1993年起制度化。报告标准随之出现:QUOROM,随后是2009年的PRISMA,并于2020年更新。GRADE工作组在21世纪初将确定性评估正式化,物理治疗领域也贡献了特定领域的工具,如PEDro量表和数据库,以使康复试验的评估系统化。
Debates
- 何时应在荟萃分析中汇总研究?
- 合并异质性研究可能会产生精确但具有误导性的总结;决定何时临床和统计异质性会阻止汇总,以及如何处理它,仍然是一个核心的方法学判断。
- 证据的确定性应如何与建议的强度区分开来?
- GRADE有意将证据的确定性与建议的强度分开,因为价值观、偏好和权衡也影响建议;持续应用这种区分是一个持续的挑战。
Key figures
- David Moher
- Matthew Page
- Gordon Guyatt
- Christopher Maher
- David Sackett
Related topics
Seminal works
- moher-2009
- page-2021
- guyatt-2008-grade
Frequently asked questions
- 系统评价和荟萃分析有什么区别?
- 系统评价使用明确、可重复的方法来查找、评估和总结研究;荟萃分析是某些评价中可选的统计步骤,当研究足够相似时,它将研究结果汇总为单一的加权估计值。
- 如果一项研究已经发表,为什么还需要批判性评估?
- 发表不保证有效性;评估旨在评估偏倚风险、效应的精确度和大小,以及研究结果是否适用于特定患者,从而根据其可信度来权衡结论。