ロジスティック回帰
ロジスティック回帰は、二値(はい/いいえ)のアウトカムが生じる確率を、1つ以上の予測変数の関数としてモデル化します。確率は0から1の間に限定されるため、このモデルは対数オッズ尺度で機能し、各係数は対数オッズの変化に対応し、指数変換するとオッズ比になります。これは、健康科学における二値アウトカムに対する標準的な回帰手法です。
Definition
ロジスティック回帰は、二値アウトカムの対数オッズ(ロジット)を予測変数の線形関数としてモデル化します。すなわち、logit(P) = b0 + b1X1 + ... + bkXk であり、最尤法によって係数を推定し、指数変換された係数 exp(bj) が予測変数 Xj の調整済みオッズ比となります。
Scope
この項目では、二項ロジスティックモデルについて扱います。具体的には、ロジットリンクとその使用理由、係数のオッズ比としての解釈、最尤推定、交絡因子調整、およびサンプルサイズ(変数あたりのイベント数)、分離、適合度に関する実践的な考慮事項です。また、オッズ比とリスク比の区別についても言及します。これは方法論的なトピックであり、臨床的ガイダンスではありません。
Core questions
- なぜ二値アウトカムは、確率として直接ではなく、対数オッズ尺度でモデル化されるのでしょうか?
- ロジスティック回帰の係数は、オッズ比としてどのように解釈されるのでしょうか?
- 係数はどのように推定され、モデルは交絡因子をどのように調整するのでしょうか?
- 安定した推定のために、予測変数あたりいくつのアウトカムイベントが必要ですか?
- オッズ比がリスク比と大きく異なるのはどのような場合ですか?
Key concepts
- ロジット(対数オッズ)リンク関数
- exp(係数)としてのオッズ比
- 最尤推定
- 調整済みオッズ比と粗オッズ比
- 変数あたりのイベント数
- 分離と準完全分離
- 適合度とキャリブレーション
- オッズ比とリスク比
Mechanisms
確率を線形予測子で直接モデル化することは、予測が0から1の範囲外になる可能性があるため問題があります。ロジットリンクは、確率を対数オッズに変換することでこの問題を解決します。対数オッズは無制限であり、線形にモデル化されます。係数は最小二乗法ではなく最尤法によって推定され、各指数変換された係数は、他の予測変数を一定に保ったまま、その予測変数が1単位変化した場合のアウトカムのオッズを比較したオッズ比です。安定した推定には、予測変数の数に対して十分なアウトカムイベントが必要です。伝統的な「変数あたり約10イベント」というガイダンスは、その後の研究で検討され、部分的に緩和されています。予測変数がアウトカムクラスを完全に分離する場合、通常の最尤法は失敗します(分離)。この問題はペナルティ付きアプローチで対処されます。このモデルはオッズ比を推定するため、アウトカムが一般的な場合にはリスク比を過大評価する可能性があり、リスク比を直接推定するための修正ポアソン回帰などの代替アプローチが提唱されています。
Clinical relevance
ロジスティック回帰は、臨床および疫学研究で報告される調整済みオッズ比や診断・予後モデルの大部分の基礎となっています。その係数がオッズ比であること、そしてそれがリスク比といつ乖離するのかを理解することは、そのような研究を解釈する上で中心的なことです。この項目は方法を説明するものであり、個々の診断や治療の決定の根拠となるものではありません。
Epidemiology
ロジスティック回帰は、オッズ比が推定可能な関連尺度である症例対照研究にとって自然な分析手法であり、コホート研究や横断研究でも二値アウトカムの調整済み効果推定値を得るために広く使用されています。コホートにおいてアウトカムが一般的な場合、オッズ比はリスク比から乖離するため、アナリストはリスク比を直接推定する手法を好むことがあります。
Evidence & guidelines
Hosmer、Lemeshow、およびSturdivantのテキストは、ロジスティックモデルの適合と評価に関する標準的な参考文献です。ロジスティック回帰を用いて構築された予測モデルの報告はTRIPOD声明でカバーされており、方法論的研究は変数あたりのイベント数などのサンプルサイズガイダンスに情報を提供しています。
History
ロジスティック関数は19世紀の人口増加にルーツを持ち、二値回帰への応用は20世紀半ばに発展しました。デビッド・コックスの研究により、二値データ分析の手法として確立されました。特にオッズ比が自然な尺度である症例対照分析において、疫学の主力ツールとなりました。その後の方法論的文献では、サンプルサイズ、分離、オッズ比とリスク比の乖離といった実践的な問題が扱われました。
Debates
- 予測変数あたりいくつのアウトカムイベントが必要か?
- 「変数あたり約10イベント」という長年の経験則はシミュレーション研究によって支持されていましたが、その後の研究ではこの経験則は保守的であり文脈依存的であると主張され、場合によってはより少ないイベントで十分なこともあれば、より多くのイベントが必要な場合もあるとされています。
- アウトカムが一般的な場合、オッズ比を使用すべきか?
- アウトカムが一般的な場合、オッズ比はリスク比を過大評価し、相対リスクとして誤解される可能性があります。修正ポアソン回帰などの代替手法はリスク比を直接推定し、二値アウトカムを伴う前向き研究に提案されています。
Key figures
- David Cox
- David Hosmer
- Stanley Lemeshow
- Peter Peduzzi
- Eric Vittinghoff
Related topics
Seminal works
- hosmer-2013
- peduzzi-1996
Frequently asked questions
- なぜロジスティック回帰はオッズ比を報告するのですか?
- モデルが対数オッズ尺度で線形であるため、各係数は対数オッズの変化を表し、それを指数変換するとオッズ比が得られます。したがって、オッズ比は、モデルが二値アウトカムに対して生成する自然な効果尺度です。
- オッズ比がリスク比の悪い近似となるのはどのような場合ですか?
- アウトカムが一般的な場合、オッズ比はリスク比から乖離し、過大評価します。そのような状況では、オッズ比を相対リスクとして解釈すると誤解を招く可能性があり、リスク比を直接推定する手法が好ましい場合があります。