ScholarGate
Asistan

Lojistik Regresyon

Lojistik regresyon, bir veya daha fazla yordayıcının bir fonksiyonu olarak ikili (evet/hayır) bir sonucun olasılığını modellemektedir. Olasılıklar 0 ile 1 arasında sınırlı olduğundan, model log-oranlar ölçeğinde çalışmaktadır, böylece her bir katsayı log-oranlardaki bir değişime karşılık gelmekte ve üslü hale getirildiğinde bir oranlar oranı (odds ratio) vermektedir. Sağlık bilimlerinde ikili sonuçlar için standart regresyon yöntemidir.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Lojistik regresyon, ikili bir sonucun log-oranlarını (logit) yordayıcıların doğrusal bir fonksiyonu olarak modellemektedir, logit(P) = b0 + b1X1 + ... + bkXk şeklinde, katsayıları en yüksek olabilirlik yöntemiyle tahmin ederek, böylece üslü katsayı exp(bj), yordayıcı Xj için ayarlanmış oranlar oranı olmaktadır.

Kapsam

Bu madde ikili lojistik modeli kapsamaktadır: logit bağlantısı ve neden kullanıldığı, katsayıların oranlar oranı olarak yorumlanması, en yüksek olabilirlik tahmini, karıştırıcı etkiler (confounding) için ayarlama ve örneklem büyüklüğü (değişken başına olay sayısı), ayrım (separation) ve uyum iyiliği gibi pratik endişeler. Ayrıca oranlar oranları ile risk oranları arasındaki ayrımı da belirtmektedir. Bu, metodolojik bir konudur, klinik bir rehberlik değildir.

Temel sorular

  • İkili bir sonuç neden doğrudan bir olasılık olarak değil de log-oranlar ölçeğinde modellenmektedir?
  • Bir lojistik regresyon katsayısı oranlar oranı olarak nasıl yorumlanmaktadır?
  • Katsayılar nasıl tahmin edilmekte ve model karıştırıcı etkiler (confounding) için nasıl ayarlama yapmaktadır?
  • Kararlı tahminler için yordayıcı başına kaç sonuç olayı gerekmektedir?
  • Oranlar oranı, risk oranından ne zaman önemli ölçüde farklılık göstermektedir?

Anahtar kavramlar

  • Logit (log-oranlar) bağlantı fonksiyonu
  • exp(katsayı) olarak oranlar oranı
  • En yüksek olabilirlik tahmini
  • Ayarlanmış ve ham oranlar oranı
  • Değişken başına olay sayısı
  • Ayrım (separation) ve yarı-tam ayrım (quasi-complete separation)
  • Uyum iyiliği ve kalibrasyon
  • Oranlar oranı ve risk oranı

Mekanizmalar

Bir olasılığı doğrusal bir yordayıcı ile doğrudan modellemek sorunludur, çünkü tahminler 0 ile 1 aralığının dışına düşebilmektedir; logit bağlantısı, olasılığı sınırsız ve doğrusal olarak modellenen log-oranlarına dönüştürerek bu sorunu çözmektedir. Katsayılar en küçük kareler yerine en yüksek olabilirlik yöntemiyle tahmin edilmektedir ve her bir üslü katsayı, diğer yordayıcılar sabit tutulduğunda, ilgili yordayıcıdaki bir birimlik fark için sonucun oranlarını karşılaştıran oranlar oranıdır. Kararlı tahmin, yordayıcı sayısına göre yeterli sayıda sonuç olayı gerektirmektedir; değişken başına yaklaşık on olay şeklindeki geleneksel rehberlik incelenmiş ve sonraki çalışmalarda kısmen esnetilmiştir. Bir yordayıcı sonuç sınıflarını mükemmel bir şekilde ayırdığında, sıradan en yüksek olabilirlik yöntemi başarısız olmakta (ayrım - separation), ve cezalandırılmış yaklaşımlar bu durumu ele almaktadır. Model oranlar oranlarını tahmin ettiği için, sonuç yaygın olduğunda bunlar risk oranını abartabilmektedir, bu durum, risk oranlarını doğrudan tahmin etmek için modifiye Poisson regresyonu gibi alternatif yaklaşımları motive etmiştir.

Klinik önem

Lojistik regresyon, klinik ve epidemiyolojik araştırmalarda bildirilen ayarlanmış oranlar oranlarının ve tanısal ve prognostik modellerin büyük bir kısmının temelini oluşturmaktadır. Katsayılarının oranlar oranı olduğunu ve bunların risk oranlarından ne zaman saptığını anlamak, bu tür çalışmaları yorumlamak için merkezi bir öneme sahiptir. Bu madde yöntemi tanımlamaktadır ve bireysel tanı veya tedavi kararları için bir temel değildir.

Epidemiyoloji

Lojistik regresyon, oranlar oranının tahmin edilebilir bir ilişki ölçüsü olduğu vaka-kontrol çalışmaları için doğal bir analiz yöntemidir ve ikili sonuçlar için ayarlanmış etki tahminleri elde etmek amacıyla kohort ve kesitsel çalışmalarda yaygın olarak kullanılmaktadır. Bir kohortta sonuç yaygın olduğunda, oranlar oranı risk oranından sapmaktadır ve analistler risk oranını doğrudan tahmin eden yöntemleri tercih edebilmektedir.

Kanıt ve kılavuzlar

Hosmer, Lemeshow ve Sturdivant'ın metni, lojistik modellerin uyarlanması ve değerlendirilmesi için standart bir referanstır. Lojistik regresyon ile oluşturulan tahmin modellerinin raporlanması TRIPOD bildirimi tarafından kapsanmaktadır ve metodolojik çalışmalar, değişken başına olay sayısı gibi örneklem büyüklüğü rehberliğine bilgi sağlamaktadır.

Tarihçe

Lojistik fonksiyonun kökenleri on dokuzuncu yüzyıldaki nüfus artışına dayanmaktadır ve ikili regresyon için kullanımı yirminci yüzyılın ortalarında geliştirilmiştir, David Cox'un ikili verilerin analizi için yöntemi sağlamlaştıran çalışmalarıyla. Epidemiyolojinin önemli bir aracı haline gelmiştir, özellikle de oranlar oranının doğal bir ölçü olduğu vaka-kontrol analizleri için. Sonraki metodolojik literatür, örneklem büyüklüğü, ayrım (separation) ve oranlar oranlarının risk oranlarından sapması gibi pratik konuları ele almıştır.

Tartışmalar

Yordayıcı başına kaç sonuç olayı gerekmektedir?
Değişken başına yaklaşık on olay şeklindeki uzun süredir devam eden bir kural, simülasyon çalışmalarıyla desteklenmiştir, ancak sonraki çalışmalar bu kuralın muhafazakar ve bağlama bağlı olduğunu, dolayısıyla bazen daha az olayın yeterli olabileceğini, bazen ise daha fazlasına ihtiyaç duyulabileceğini öne sürmüştür.
Sonuç yaygın olduğunda oranlar oranı kullanılmalı mıdır?
Bir sonuç yaygın olduğunda, oranlar oranı risk oranını abartmakta ve göreceli risk olarak yanlış yorumlanabilmektedir; modifiye Poisson regresyonu gibi alternatifler risk oranını doğrudan tahmin etmekte ve ikili sonuçları olan prospektif çalışmalar için önerilmiştir.

Öne çıkan isimler

  • David Cox
  • David Hosmer
  • Stanley Lemeshow
  • Peter Peduzzi
  • Eric Vittinghoff

İlgili konular

Temel eserler

  • hosmer-2013
  • peduzzi-1996

Sıkça sorulan sorular

Lojistik regresyon neden oranlar oranlarını raporlamaktadır?
Model log-oranlar ölçeğinde doğrusal olduğu için, her bir katsayı log-oranlardaki bir değişimi temsil etmekte ve bunu üslü hale getirmek bir oranlar oranı vermektedir. Bu nedenle oranlar oranı, modelin ikili bir sonuç için ürettiği doğal etki ölçüsüdür.
Oranlar oranı, risk oranına ne zaman kötü bir yaklaşım olmaktadır?
Sonuç yaygın olduğunda, oranlar oranı risk oranından sapmakta ve onu abartmaktadır. Bu durumda, bir oranlar oranı göreceli risk olarak okunursa yanıltıcı olabilmekte ve risk oranını doğrudan tahmin eden yöntemler tercih edilebilir.

Bu kavram için yöntemler

İlgili kavramlar