Yoğunluk Tahmini
Yoğunluk tahmini, parametrik bir form varsaymadan bir örneklemden bir dağılımın şeklini yeniden oluşturmaktadır; bir düzeltme parametresi, detay ve gürültü arasındaki dengeyi yönetmektedir.
Tanım
Yoğunluk tahmini, bir rastgele değişkenin olasılık yoğunluk fonksiyonunu bir örneklemden, tipik olarak ampirik veriyi bir çekirdek (kernel) ve bir bant genişliği (bandwidth) ile düzelterek tahmin etme problemidir.
Kapsam
Bu konu, histogramı ve kutu genişliği seçimini, Parzen-Rosenblatt tipi çekirdek yoğunluk tahmin edicilerini, çekirdek ve bant genişliği seçimini, ortalama entegre kare hatanın yanlılık-varyans ayrışımını, eklenti (plug-in) ve çapraz doğrulama bant genişliği seçimini, sınır etkilerini ve adaptif bant genişliklerini, boyutsallık lanetini ve düzgünlük sınıfları üzerindeki yakınsama için minimaks oranlarını kapsamaktadır.
Temel sorular
- Bir çekirdek yoğunluk tahmin edicisi veriyi nasıl düzeltmektedir ve bant genişliği hangi rolü oynamaktadır?
- Yanlılık-varyans dengesi, optimal düzeltme miktarını nasıl belirlemektedir?
- Bant genişliği pratikte çapraz doğrulama veya eklenti (plug-in) kurallarıyla nasıl seçilmektedir?
- Yoğunluk tahmini neden yüksek boyutlarda zorlaşmaktadır?
Temel kuramlar
- Çekirdek yoğunluk tahmini
- Her veri noktasına düzgün bir çekirdek yerleştirip ortalamasını almak, yoğunluğun düzgün bir tahminini vermektedir; bant genişliği, çekirdeklerin genişliğini ve dolayısıyla tahminin düzgünlüğünü kontrol etmektedir.
- Yanlılık-varyans dengesi ve minimaks oranları
- Küçük bir bant genişliği düşük yanlılık ancak yüksek varyans verirken, büyük bir bant genişliği bunun tersini vermektedir; optimal bant genişliği bunları dengelemekte ve ortaya çıkan risk, yoğunluğun düzgünlüğü tarafından belirlenen minimaks oranda azalmaktadır.
Klinik önem
Çekirdek yoğunluk tahminleri, verileri keşfetmek için kullanılan düzgün dağılım grafiklerinin, parametrik olmayan sınıflandırıcıların ve naive-Bayes modellerinin oluşturulmasının, sağkalım analizinde tehlike ve yoğunluk tahmininin ve epidemiyoloji ve ekolojide mekansal nokta örüntülerinin görselleştirilmesinin temelini oluşturmaktadır.
Tarihçe
Rosenblatt, çekirdek yoğunluk tahmin edicisini 1956'da tanıtmış ve Parzen, teorisini 1962'de geliştirmiştir. Silverman'ın 1986 tarihli monografisi, pratik bant genişliği seçimi de dahil olmak üzere yöntemleri geniş çapta erişilebilir hale getirmiş ve sonrasında minimaks analizi optimallik teorisini keskinleştirmiştir.
Öne çıkan isimler
- Murray Rosenblatt
- Emanuel Parzen
- Bernard Silverman
- Larry Wasserman
İlgili konular
Temel eserler
- wasserman2006
Sıkça sorulan sorular
- Bant genişliği neden çekirdekten daha önemlidir?
- Çekirdek şeklinin seçimi doğruluğu üzerinde çok az etkiye sahiptir, ancak bant genişliği yanlılık-varyans dengesini doğrudan kontrol etmektedir: çok küçük olduğunda tahmin sivri ve gürültülü olmakta, çok büyük olduğunda ise gerçek özellikler düzeltilerek kaybolmaktadır.
- Yoğunluk tahmininde boyutsallık laneti nedir?
- Değişken sayısı arttıkça, veriler seyrek hale gelmekte ve belirli bir doğruluk için gereken miktar patlayıcı bir şekilde artmaktadır; bu nedenle parametrik olmayan yoğunluk tahmini, ek bir yapı olmaksızın yalnızca düşük boyutlarda güvenilirdir.