ScholarGate
Asisten

Regresi Logistik

Regresi logistik memodelkan probabilitas hasil biner (ya/tidak) sebagai fungsi dari satu atau lebih prediktor. Karena probabilitas dibatasi antara 0 dan 1, model ini bekerja pada skala log-odds, sehingga setiap koefisien sesuai dengan perubahan dalam log-odds dan dieksponensialkan menjadi rasio odds. Ini adalah metode regresi standar untuk hasil biner dalam ilmu kesehatan.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Regresi logistik memodelkan log-odds (logit) dari hasil biner sebagai fungsi linier dari prediktor, logit(P) = b0 + b1X1 + ... + bkXk, mengestimasi koefisien dengan kemungkinan maksimum sehingga koefisien yang dieksponensialkan exp(bj) adalah rasio odds yang disesuaikan untuk prediktor Xj.

Scope

Entri ini mencakup model logistik biner: tautan logit dan mengapa digunakan, interpretasi koefisien sebagai rasio odds, estimasi kemungkinan maksimum, penyesuaian untuk variabel pengganggu, dan masalah praktis ukuran sampel (kejadian per variabel), pemisahan, dan kecocokan model. Ini juga mencatat perbedaan antara rasio odds dan rasio risiko. Ini adalah topik metodologis, bukan panduan klinis.

Core questions

  • Mengapa hasil biner dimodelkan pada skala log-odds daripada langsung sebagai probabilitas?
  • Bagaimana koefisien regresi logistik diinterpretasikan sebagai rasio odds?
  • Bagaimana koefisien diestimasi, dan bagaimana model menyesuaikan untuk variabel pengganggu?
  • Berapa banyak kejadian hasil yang dibutuhkan per prediktor untuk estimasi yang stabil?
  • Kapan rasio odds berbeda secara signifikan dari rasio risiko?

Key concepts

  • Fungsi tautan logit (log-odds)
  • Rasio odds sebagai exp(koefisien)
  • Estimasi kemungkinan maksimum
  • Rasio odds yang disesuaikan versus mentah
  • Kejadian per variabel
  • Pemisahan dan pemisahan kuasi-lengkap
  • Kecocokan model dan kalibrasi
  • Rasio odds versus rasio risiko

Mechanisms

Memodelkan probabilitas secara langsung dengan prediktor linier bermasalah karena prediksi dapat jatuh di luar 0 hingga 1; tautan logit memecahkan masalah ini dengan mengubah probabilitas menjadi log-odds-nya, yang tidak terbatas dan dimodelkan secara linier. Koefisien diestimasi dengan kemungkinan maksimum daripada kuadrat terkecil, dan setiap koefisien yang dieksponensialkan adalah rasio odds yang membandingkan odds hasil untuk perbedaan satu unit dalam prediktor tersebut dengan prediktor lain yang dianggap konstan. Estimasi yang stabil membutuhkan cukup banyak kejadian hasil relatif terhadap jumlah prediktor; panduan tradisional sekitar sepuluh kejadian per variabel telah diteliti dan sebagian dilonggarkan dalam penelitian selanjutnya. Ketika prediktor secara sempurna memisahkan kelas hasil, kemungkinan maksimum biasa gagal (pemisahan), dan pendekatan yang dihukum mengatasinya. Karena model mengestimasi rasio odds, ini dapat melebih-lebihkan rasio risiko ketika hasilnya umum, yang telah memotivasi pendekatan alternatif seperti regresi Poisson yang dimodifikasi untuk mengestimasi rasio risiko secara langsung.

Clinical relevance

Regresi logistik mendasari sebagian besar rasio odds yang disesuaikan serta model diagnostik dan prognostik yang dilaporkan dalam penelitian klinis dan epidemiologi. Memahami bahwa koefisiennya adalah rasio odds, dan kapan koefisien tersebut menyimpang dari rasio risiko, sangat penting untuk menafsirkan studi semacam itu. Entri ini menjelaskan metode dan bukan dasar untuk keputusan diagnostik atau pengobatan individu.

Epidemiology

Regresi logistik adalah analisis alami untuk studi kasus-kontrol, di mana rasio odds adalah ukuran asosiasi yang dapat diestimasi, dan banyak digunakan dalam studi kohort dan potong lintang untuk mendapatkan estimasi efek yang disesuaikan untuk hasil biner. Ketika hasilnya umum dalam suatu kohort, rasio odds menyimpang dari rasio risiko, dan analis mungkin lebih memilih metode yang mengestimasi rasio risiko secara langsung.

Evidence & guidelines

Teks Hosmer, Lemeshow, dan Sturdivant adalah referensi standar untuk menyesuaikan dan menilai model logistik. Pelaporan model prediksi yang dibangun dengan regresi logistik dicakup oleh pernyataan TRIPOD, dan studi metodologis menginformasikan panduan ukuran sampel seperti kejadian per variabel.

History

Fungsi logistik memiliki akar abad kesembilan belas dalam pertumbuhan populasi, dan penggunaannya untuk regresi biner dikembangkan pada pertengahan abad kedua puluh, dengan karya David Cox yang mengkonsolidasikan metode untuk analisis data biner. Ini menjadi alat utama epidemiologi, terutama untuk analisis kasus-kontrol di mana rasio odds adalah ukuran alami. Literatur metodologis selanjutnya membahas masalah praktis termasuk ukuran sampel, pemisahan, dan divergensi rasio odds dari rasio risiko.

Debates

Berapa banyak kejadian hasil yang dibutuhkan per prediktor?
Aturan lama sekitar sepuluh kejadian per variabel didukung oleh pekerjaan simulasi, tetapi studi selanjutnya berpendapat bahwa aturan tersebut konservatif dan tergantung konteks, sehingga lebih sedikit kejadian mungkin kadang-kadang cukup sementara lebih banyak mungkin diperlukan dalam kasus lain.
Haruskah rasio odds digunakan ketika hasilnya umum?
Ketika suatu hasil umum, rasio odds melebih-lebihkan rasio risiko dan dapat disalahartikan sebagai risiko relatif; alternatif seperti regresi Poisson yang dimodifikasi mengestimasi rasio risiko secara langsung dan telah diusulkan untuk studi prospektif dengan hasil biner.

Key figures

  • David Cox
  • David Hosmer
  • Stanley Lemeshow
  • Peter Peduzzi
  • Eric Vittinghoff

Related topics

Seminal works

  • hosmer-2013
  • peduzzi-1996

Frequently asked questions

Mengapa regresi logistik melaporkan rasio odds?
Karena model ini linier pada skala log-odds, setiap koefisien mewakili perubahan dalam log-odds, dan mengeksponensialkannya memberikan rasio odds. Oleh karena itu, rasio odds adalah ukuran efek alami yang dihasilkan model untuk hasil biner.
Kapan rasio odds merupakan perkiraan yang buruk untuk rasio risiko?
Ketika hasilnya umum, rasio odds menyimpang dari dan melebih-lebihkan rasio risiko. Dalam situasi tersebut, rasio odds dapat menyesatkan jika dibaca sebagai risiko relatif, dan metode yang mengestimasi rasio risiko secara langsung mungkin lebih disukai.

Methods for this concept

Related concepts