Cox 回归模型
Cox 回归——即比例风险模型——是用于将一个或多个协变量与事件发生时间结果的发生率相关联的最广泛使用的方法。其关键创新在于,它在不要求对潜在(基线)风险形状进行任何假设的情况下,估计协变量如何使风险倍增,从而在正确处理审查的同时,得出可解释的风险比。
Definition
Cox 比例风险模型将受试者的风险表示为未指定基线风险乘以协变量线性组合的指数,其中回归系数通过最大化仅依赖于事件时间排序的部分似然来估计。
Scope
本主题涵盖 Cox 模型的结构、允许在不指定基线风险的情况下进行估计的部分似然、风险比的解释,以及有效使用所依赖的假设和诊断。它属于方法学参考资料,不构成临床指导。
Core questions
- Cox 模型如何在不指定基线形状的情况下将协变量与风险相关联?
- 什么是部分似然,为什么它允许从审查的、有序的事件时间进行估计?
- 风险比如何解释,其局限性是什么?
- 哪些假设和诊断管理着模型的有效使用?
Key concepts
- 基线风险(未指定)
- 风险比
- 部分似然
- 风险集和事件排序
- 半参数模型
- 比例风险假设
- 绑定的事件时间
- 时变协变量
Mechanisms
该模型将受试者的风险写为任意基线风险(所有受试者共有)与一个因子 exp(beta'x) 的乘积,该因子根据受试者的协变量对其进行缩放。Cox 的核心见解是部分似然:在每个事件发生时,贡献是实际发生事件的受试者在所有仍在风险中的受试者中失败的概率,这仅取决于协变量和风险集的组成,而不取决于基线风险的形式。最大化这些贡献的乘积可以得到系数估计值,对系数取指数可以得到风险比——即该协变量每单位事件发生率的乘法变化。由于基线风险是自由的,因此该模型是半参数的;审查受试者在审查时间之前对风险集做出贡献。有效的推断基于比例风险假设,并通过基于残差的诊断进行检查(Cox, 1972; Schoenfeld, 1982; Bradburn et al., 2003)。
Clinical relevance
临床文献中大多数关于预后因素和治疗对生存影响的调整估计都来自 Cox 模型,并以风险比的形式报告;理解该模型有助于评估这些估计,包括是否解决了混杂因素并检查了假设。本条目是对方法学的描述,并非个体临床决策的基础。
Epidemiology
Cox 回归是临床和流行病学研究中事件发生时间结果的默认多变量方法;Cox 1972 年的论文是迄今为止被引用最多的统计学论文之一,反映了其近乎普遍的采用(Cox, 1972)。
Evidence & guidelines
该模型本身没有临床指南;方法学参考文献包括 Cox 1972 年的论文、基于部分残差的诊断发展(Schoenfeld, 1982),以及涵盖扩展和良好实践的著作(Therneau & Grambsch, 2000; Collett, 2015),以及面向医学受众的教程(Bradburn et al., 2003)。
History
Cox 在其 1972 年的论文中引入了比例风险模型和部分似然,通过允许协变量调整回归而无需承诺参数基线风险,从而改变了生存分析。部分似然作为推断基础的合理性,以及一系列诊断和扩展(分层、时变协变量、残差检查),在随后的几十年中得到了发展(Schoenfeld, 1982; Therneau & Grambsch, 2000)。
Debates
- 如何处理绑定的事件时间?
- 当多个事件共享一个事件时间时,必须近似部分似然,并且方法(Breslow、Efron、精确)有所不同;选择很少改变结论,但在存在大量绑定时很重要,并且是标准的实现决策。
Key figures
- David R. Cox
- David Schoenfeld
- Terry Therneau
- Patricia Grambsch
Related topics
Seminal works
- cox-1972
Frequently asked questions
- 为什么 Cox 模型被称为半参数模型?
- 它通过 exp(beta'x) 以参数方式模拟协变量效应,但完全不指定基线风险,因此它结合了参数回归部分和非参数基线。
- Cox 模型中风险比为 2 意味着什么?
- 这意味着模型估计比较组或协变量每增加一个单位的瞬时事件发生率是两倍,假设该比率在随访期间是恒定的(比例风险假设)。