分析验证和检测准确性
分析验证是指在用于检测患者之前,证明测量程序按预期执行的过程;检测准确性描述了检测结果反映真实临床状态的程度。两者共同回答了两个不同的问题:该检测方法是否可靠地测量了其声称要测量的东西(分析性能),以及结果是否正确地对患者进行了分类(诊断准确性)?
Definition
分析验证是书面证明测量程序符合预定义的性能规范,例如精密度、准确度和检测限;诊断检测准确性是指相对于参考标准,检测正确区分目标疾病存在与否的程度。
Scope
本主题涵盖了在方法验证过程中确立的分析性能特征——精密度、准确度、线性、检测限和定量限,以及分析特异性和干扰——以及将检测结果与临床参考标准相关联的诊断准确性测量,包括敏感性、特异性和预测值。它是一个方法学参考,不规定如何验证或解释任何特定检测。
Core questions
- 在临床使用方法之前,必须确立哪些分析性能特征?
- 精密度和准确度有何不同,以及如何估计它们?
- 敏感性、特异性和预测值如何定义和解释?
- 为什么诊断准确性必须根据参考标准进行判断,以及如何透明地报告?
Key concepts
- 验证与核查
- 精密度(重复性和再现性)
- 准确度和偏差
- 检测限和定量限
- 线性和分析测量范围
- 分析特异性和干扰
- 敏感性和特异性
- 预测值和流行率依赖性
- 方法比较(Bland-Altman一致性)
- 参考标准
Mechanisms
分析验证根据预定义的规范来表征测量程序。精密度——重复结果的接近程度——通过在重复性和再现性条件下进行重复测量来估计;准确度——与真实值的接近程度——通过参考物质或比较方法进行评估,偏差量化了差异。检测限和定量限定义了方法可以可靠报告的最低浓度,线性定义了分析测量范围,干扰研究确立了分析特异性。诊断准确性是一个独立的评估:将检测结果与参考标准进行比较,以计算敏感性(正确识别的真阳性患者比例)和特异性(正确识别的真阴性患者比例)。预测值将这些转化为给定结果下患病的概率,因此取决于被检测人群中疾病的流行率。方法比较研究,通常用Bland-Altman一致性图总结,评估新程序是否与已建立的程序一致。
Clinical relevance
未经分析验证或诊断准确性特征不明确的检测可能会误导临床医生;特别是预测值会随疾病流行率而变化,因此相同的敏感性和特异性在筛查和高流行率环境中具有不同的含义。本主题描述了如何确立和报告这些性能;它有助于对检测进行批判性评估,而不是个体诊断决策的基础。
Evidence & guidelines
诊断准确性研究的透明报告遵循STARD声明,其2015年修订版列出了必要的报告项目。分析性能评估遵循标准化协议,例如CLSI EP系列用于精密度和方法比较,方法一致性通常采用Bland-Altman方法评估。特定学科指南定义了特定分析物的质量和验证要求。
History
随着敏感性和特异性(源自筛查理论)成为检测性能的标准描述,以及贝叶斯推理阐明了预测值如何依赖于流行率,诊断检测评估日趋成熟。Bland和Altman于1986年提出的方法一致性方法重塑了新测量程序与已建立程序进行比较的方式。对诊断准确性研究报告不完整的担忧促成了STARD报告指南的发布,该指南于2003年首次发布并于2015年更新,同时标准机构也对分析验证协议进行了编纂。
Debates
- 方法的验证与核查
- 开发新方法的实验室必须充分验证其性能,而采用已验证商业方法的实验室只需核查其在本地操作中是否如声称般执行;每种情况需要多少证据,以及界限在哪里,是一个反复出现的实际问题。
- 诊断准确性研究的报告和可重复性
- 患者选择、参考标准和不确定结果的报告不完整可能会夸大表观准确性,这促使了STARD清单的制定;关于研究遵守该清单的程度的争论仍在继续。
Key figures
- Patrick Bossuyt
- J. Martin Bland
- Douglas G. Altman
Related topics
Seminal works
- bland-altman-1986
- bossuyt-2015
Frequently asked questions
- 分析验证和诊断准确性之间有什么区别?
- 分析验证表明测量程序可靠地执行——具有足够的精密度、准确度和检测限——而诊断准确性描述了所得值根据临床参考标准正确分类患者的程度。一项检测可能在分析上是可靠的,但诊断准确性有限,反之亦然。
- 为什么预测值在不同环境中会发生变化,而敏感性和特异性保持相似?
- 敏感性和特异性主要取决于检测本身的特性,但预测值——给定结果下患病的概率——也取决于该疾病在被检测人群中的普遍程度,因此相同的检测根据流行率的不同而提供的信息量也不同。