ScholarGate
助手

逻辑回归

逻辑回归将二元(是/否)结果的概率建模为一项或多项预测因子(自变量)的函数。由于概率介于0和1之间,该模型在对数优势比(log-odds)尺度上进行工作,因此每个系数对应于对数优势比的变化,并指数化为优势比。它是健康科学中用于二元结果的标准回归方法。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

逻辑回归将二元结果的对数优势比(logit)建模为预测因子的线性函数,即 logit(P) = b0 + b1X1 + ... + bkXk,通过最大似然法估计系数,使得指数化系数 exp(bj) 是预测因子 Xj 的调整优势比。

Scope

本条目涵盖二元逻辑模型:logit链接函数及其使用原因,将系数解释为优势比,最大似然估计,混杂因素调整,以及样本量(每个变量的事件数)、分离和拟合优度等实际问题。它还指出了优势比和风险比之间的区别。这是一个方法学主题,而非临床指导。

Core questions

  • 为什么二元结果在对数优势比尺度上建模而不是直接作为概率建模?
  • 如何将逻辑回归系数解释为优势比?
  • 系数是如何估计的,模型如何调整混杂因素?
  • 每个预测因子需要多少结局事件才能获得稳定的估计?
  • 优势比何时与风险比有显著差异?

Key concepts

  • Logit(对数优势比)链接函数
  • 优势比作为 exp(系数)
  • 最大似然估计
  • 调整优势比与粗优势比
  • 每个变量的事件数
  • 分离和准完全分离
  • 拟合优度和校准
  • 优势比与风险比

Mechanisms

直接使用线性预测因子对概率进行建模存在问题,因为预测值可能超出0到1的范围;logit链接函数通过将概率转换为其对数优势比来解决此问题,对数优势比是无界的并可以线性建模。系数通过最大似然法而非最小二乘法进行估计,每个指数化系数是比较在其他预测因子保持不变的情况下,该预测因子每增加一个单位时结果发生优势比的优势比。稳定的估计需要足够的结局事件数相对于预测因子数量;传统的每个变量大约十个事件的指导原则已在后续研究中得到检验和部分放宽。当预测因子完美地分离结局类别时,普通最大似然法会失效(分离),惩罚性方法可以解决此问题。由于模型估计的是优势比,当结局常见时,这些优势比可能会高估风险比,这促使了替代方法(例如修正泊松回归)的出现,以直接估计风险比。

Clinical relevance

逻辑回归是临床和流行病学研究中报告的大部分调整优势比以及诊断和预后模型的基础。理解其系数是优势比,以及何时这些优势比与风险比存在差异,对于解释此类研究至关重要。本条目描述了该方法,并非个体诊断或治疗决策的依据。

Epidemiology

逻辑回归是病例对照研究的自然分析方法,其中优势比是可估计的关联度量,并广泛用于队列研究和横断面研究中,以获得二元结果的调整效应估计。当队列中结局常见时,优势比会偏离风险比,分析人员可能更倾向于直接估计风险比的方法。

Evidence & guidelines

Hosmer、Lemeshow 和 Sturdivant 的著作是拟合和评估逻辑模型的标准参考。使用逻辑回归构建的预测模型的报告由 TRIPOD 声明涵盖,方法学研究为样本量指导(例如每个变量的事件数)提供了信息。

History

逻辑函数起源于19世纪的人口增长研究,其用于二元回归的用途在20世纪中期得到发展,David Cox 的工作巩固了二元数据分析的方法。它成为流行病学的重要工具,特别是对于优势比是自然度量的病例对照分析。随后的方法学文献解决了包括样本量、分离以及优势比与风险比差异在内的实际问题。

Debates

每个预测因子需要多少结局事件?
长期以来关于每个变量大约十个事件的规则得到了模拟研究的支持,但后来的研究认为该规则是保守且依赖于上下文的,因此有时较少的事件可能就足够,而在其他情况下可能需要更多。
当结局常见时是否应使用优势比?
当结局常见时,优势比会高估风险比,并可能被误解为相对风险;修正泊松回归等替代方法直接估计风险比,并已被提议用于具有二元结局的前瞻性研究。

Key figures

  • David Cox
  • David Hosmer
  • Stanley Lemeshow
  • Peter Peduzzi
  • Eric Vittinghoff

Related topics

Seminal works

  • hosmer-2013
  • peduzzi-1996

Frequently asked questions

为什么逻辑回归报告优势比?
因为模型在对数优势比尺度上是线性的,每个系数代表对数优势比的变化,对其进行指数化即可得到优势比。因此,优势比是模型为二元结果产生的自然效应度量。
优势比何时是风险比的不良近似?
当结局常见时,优势比会偏离并高估风险比。在这种情况下,如果将优势比解读为相对风险,可能会产生误导,此时直接估计风险比的方法可能更可取。

Methods for this concept

Related concepts