因果关系评估与归因
因果关系评估是一个结构化过程,药械警戒部门通过此过程判断特定药物在特定患者或报告中引起特定不良事件的可能性。由于单个病例很少能证明因果关系,该领域依赖于透明的标准——时间、停药再观察和再次用药、替代解释以及药物的既往知识——来评估可疑药物-事件关系的强度。
Definition
因果关系评估是对可疑药物导致所观察到的不良事件的概率进行评价,根据单个病例或报告中的时间、药理学和临床证据,以分级可能性(例如,确定、很可能、可能、不太可能)表示。
Scope
本领域旨在引导读者理解在个体病例报告层面将不良事件归因于药物的逻辑。它涵盖了主要的方法家族(专家整体内省法、结构化算法和概率方法)、它们共有的标准以及用于表达评估结果的标准可能性类别。它将因果关系评估视为药械警戒中的方法学参考主题,而非针对任何个体患者的临床指导。
Sub-topics
Core questions
- 如何从单个病例而非群体研究中判断药物对不良事件的贡献?
- 哪些标准区分了专家整体内省法、算法法和概率法(贝叶斯法)的因果关系评估方法?
- 时间、停药再观察、再次用药和排除替代原因如何结合成一个可能性类别?
- 为什么不同的评估方法在同一病例上经常存在分歧,这对重现性意味着什么?
Key concepts
- 归因性和可能性类别(确定、很可能、可能、不太可能、无法分类)
- 专家整体内省法
- 结构化算法(例如,Naranjo算法)
- 概率和贝叶斯因果关系评估
- 暴露与事件之间的时间关系
- 停药再观察和再次用药
- 排除替代原因
- 评估者间重现性
- 个体病例安全性报告(ICSR)
Mechanisms
因果关系评估方法分为三大类。专家整体内省法依赖于一名或多名评估者在没有固定评分方案的情况下权衡所有可用信息的临床判断,这种方法灵活但重现性差。结构化算法将重复出现的标准——时间合理性、停药反应(停药再观察)、再次用药反应(再次用药)、存在替代原因以及既往反应报告——转化为带有加权答案的明确问题,从而得出可能性类别;Naranjo算法是应用最广泛的例子。概率方法,包括贝叶斯方法,将评估结果表示为药物而非替代原因导致事件的后验几率,结合基于背景流行病学的先验信息与观察到的病例特征的可能性。在这三类方法中,共同的构成要素是时间、停药再观察和再次用药,以及排除竞争性解释。
Clinical relevance
因果关系评估是信号检测、监管报告和药品标签的基础,因此理解其逻辑是制药和健康科学中证据评估的一部分。它描述了如何判断和记录不良事件与药物的相关性;它表征了安全证据是如何产生的,而不是个体诊断或治疗决策的基础。
Evidence & guidelines
对已发表方法的系统比较发现,没有单一技术可以被视为金标准,这些方法在应用于同一病例时经常存在分歧,并且重现性和有效性仍然有限;结构化算法提高了非结构化专家判断的一致性,但未能解决单病例推断的根本不确定性(Agbabiaka 2008;Hutchinson & Lane 1989)。世界卫生组织乌普萨拉监测中心(WHO-UMC)的可能性类别和Naranjo算法等结构化工具是表达和标准化评估结果的常规参考框架。
History
在20世纪60年代初的沙利度胺悲剧以及国家和国际自发报告系统整合之后,对将不良事件归因于药物的关注日益增加。Karch和Lasagna在1977年呼吁对药物不良反应进行操作性定义,这构成了从印象到明确标准的问题,而Naranjo及其同事在1981年提出的算法提供了一个可重现的评分方案,成为标准参考。随后的几十年产生了大量的结构化和概率方法,系统评价后来记录了它们的增殖和持续的分歧。
Debates
- 是否存在因果关系评估的金标准方法?
- 系统评价发现,许多现有方法——整体内省法、算法和贝叶斯方法——在同一病例上的评估结果不同,并且没有一种方法可以被认为是绝对有效的,这使得方法的选择仍然是一个持续的方法学判断。
Key figures
- Cesar A. Naranjo
- I. Ralph Edwards
- Jeffrey K. Aronson
- Louis Lasagna
- Fred E. Karch
- Thomas A. Hutchinson
Related topics
Seminal works
- naranjo-1981
- karch-lasagna-1977
- agbabiaka-2008
Frequently asked questions
- 药械警戒中的因果关系评估是什么?
- 它是对特定药物在个体报告中引起特定不良事件的可能性进行结构化判断,以分级可能性表示,例如确定、很可能、可能或不太可能。
- 为什么因果关系评估方法有时会存在分歧?
- 不同的方法对共同标准——时间、停药再观察和再次用药以及替代原因——的权重不同,而且单个病例很少包含足够的信息来做出决定性判断,因此系统评价发现没有单一方法是金标准。