ScholarGate
Asistan

Yoğunluk Tahmini

Yoğunluk tahmini, parametrik bir form varsaymadan bir örneklemden bir dağılımın şeklini yeniden oluşturmaktadır; bir düzeltme parametresi, detay ve gürültü arasındaki dengeyi yönetmektedir.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Yoğunluk tahmini, bir rastgele değişkenin olasılık yoğunluk fonksiyonunu bir örneklemden, tipik olarak ampirik veriyi bir çekirdek (kernel) ve bir bant genişliği (bandwidth) ile düzelterek tahmin etme problemidir.

Kapsam

Bu konu, histogramı ve kutu genişliği seçimini, Parzen-Rosenblatt tipi çekirdek yoğunluk tahmin edicilerini, çekirdek ve bant genişliği seçimini, ortalama entegre kare hatanın yanlılık-varyans ayrışımını, eklenti (plug-in) ve çapraz doğrulama bant genişliği seçimini, sınır etkilerini ve adaptif bant genişliklerini, boyutsallık lanetini ve düzgünlük sınıfları üzerindeki yakınsama için minimaks oranlarını kapsamaktadır.

Temel sorular

  • Bir çekirdek yoğunluk tahmin edicisi veriyi nasıl düzeltmektedir ve bant genişliği hangi rolü oynamaktadır?
  • Yanlılık-varyans dengesi, optimal düzeltme miktarını nasıl belirlemektedir?
  • Bant genişliği pratikte çapraz doğrulama veya eklenti (plug-in) kurallarıyla nasıl seçilmektedir?
  • Yoğunluk tahmini neden yüksek boyutlarda zorlaşmaktadır?

Temel kuramlar

Çekirdek yoğunluk tahmini
Her veri noktasına düzgün bir çekirdek yerleştirip ortalamasını almak, yoğunluğun düzgün bir tahminini vermektedir; bant genişliği, çekirdeklerin genişliğini ve dolayısıyla tahminin düzgünlüğünü kontrol etmektedir.
Yanlılık-varyans dengesi ve minimaks oranları
Küçük bir bant genişliği düşük yanlılık ancak yüksek varyans verirken, büyük bir bant genişliği bunun tersini vermektedir; optimal bant genişliği bunları dengelemekte ve ortaya çıkan risk, yoğunluğun düzgünlüğü tarafından belirlenen minimaks oranda azalmaktadır.

Klinik önem

Çekirdek yoğunluk tahminleri, verileri keşfetmek için kullanılan düzgün dağılım grafiklerinin, parametrik olmayan sınıflandırıcıların ve naive-Bayes modellerinin oluşturulmasının, sağkalım analizinde tehlike ve yoğunluk tahmininin ve epidemiyoloji ve ekolojide mekansal nokta örüntülerinin görselleştirilmesinin temelini oluşturmaktadır.

Tarihçe

Rosenblatt, çekirdek yoğunluk tahmin edicisini 1956'da tanıtmış ve Parzen, teorisini 1962'de geliştirmiştir. Silverman'ın 1986 tarihli monografisi, pratik bant genişliği seçimi de dahil olmak üzere yöntemleri geniş çapta erişilebilir hale getirmiş ve sonrasında minimaks analizi optimallik teorisini keskinleştirmiştir.

Öne çıkan isimler

  • Murray Rosenblatt
  • Emanuel Parzen
  • Bernard Silverman
  • Larry Wasserman

İlgili konular

Temel eserler

  • wasserman2006

Sıkça sorulan sorular

Bant genişliği neden çekirdekten daha önemlidir?
Çekirdek şeklinin seçimi doğruluğu üzerinde çok az etkiye sahiptir, ancak bant genişliği yanlılık-varyans dengesini doğrudan kontrol etmektedir: çok küçük olduğunda tahmin sivri ve gürültülü olmakta, çok büyük olduğunda ise gerçek özellikler düzeltilerek kaybolmaktadır.
Yoğunluk tahmininde boyutsallık laneti nedir?
Değişken sayısı arttıkça, veriler seyrek hale gelmekte ve belirli bir doğruluk için gereken miktar patlayıcı bir şekilde artmaktadır; bu nedenle parametrik olmayan yoğunluk tahmini, ek bir yapı olmaksızın yalnızca düşük boyutlarda güvenilirdir.

Bu kavram için yöntemler

İlgili kavramlar