Bootstrap ve Yeniden Örnekleme
Bootstrap, gözlemlenen verileri yeniden örnekleyerek bir istatistiğin örnekleme dağılımını tahmin etmekte, böylece çözümü zor formüllerin yerini hesaplamalar almaktadır.
Tanım
Bootstrap, gözlemlenen örneği popülasyon olarak kabul ederek ve genellikle yerine koyarak ondan tekrar tekrar örnekler çekerek bir istatistiğin örnekleme dağılımını yaklaştıran bir yeniden örnekleme yöntemidir; bu yöntem standart hataları, güven aralıklarını ve yanlılığı (bias) tahmin etmek için kullanılmaktadır.
Kapsam
Bu konu, yerine koyarak yeniden örnekleme yoluyla parametrik olmayan bootstrap'ı, parametrik bootstrap'ı, jackknife yöntemini ve onun yanlılık (bias) ve varyans tahminlerini, permütasyon testlerini, bootstrap standart hatalarını ve yüzdelik, yanlılık düzeltmeli ve bootstrap-t güven aralıklarını, bootstrap'ın tutarlılığını ve Edgeworth açılımları aracılığıyla daha yüksek dereceli doğruluğunu ve sıradan bootstrap'ın başarısız olduğu örnek maksimum gibi iyi bilinen durumları kapsamaktadır.
Temel sorular
- Verileri yeniden örneklemek, bir istatistiğin örnekleme dağılımını nasıl yaklaştırmaktadır?
- Bootstrap güven aralıkları nasıl oluşturulmaktadır ve yüzdelik ile bootstrap-t aralıkları nasıl farklılık göstermektedir?
- Bootstrap ne zaman tutarlıdır ve ne zaman başarısız olmaktadır?
- Bir permütasyon testi, kesin bir dağılımdan bağımsız test elde etmek için yeniden örneklemeyi nasıl kullanmaktadır?
Temel kuramlar
- Bootstrap ilkesi
- Bilinmeyen popülasyonu ampirik dağılım ile yaklaştırmak ve ondan yeniden örnekleme yapmak, kapalı formda bir dağılım mevcut olmasa bile hemen hemen her istatistiğin örnekleme değişkenliğinin simülasyon yoluyla tahmin edilmesini sağlamaktadır.
- Bootstrap tutarlılığı ve doğruluğu
- Düzgün istatistikler için bootstrap tutarlıdır ve Edgeworth açılımları aracılığıyla belirli bootstrap aralıkları normal yaklaşımdan daha doğru olabilmektedir; maksimum gibi düzgün olmayan fonksiyoneller için ise başarısız olabilmektedir.
Klinik önem
Bootstrap, medyanlar, korelasyonlar ve makine öğrenimi tahminleri gibi analitik formüllerin mevcut olmadığı karmaşık tahminciler için standart hatalar ve güven aralıkları sağlamaktadır; permütasyon testleri ise genomik ve randomize deneylerde yaygın olarak kullanılan kesin anlamlılık değerlendirmeleri sunmaktadır.
Tarihçe
Quenouille ve Tukey, 1950'lerde jackknife yöntemini geliştirmişlerdir. Efron, 1979'da bootstrap'ı tanıtarak bu yeniden örnekleme fikirlerini birleştirmiş ve genişletmiştir; Hall'ın 1980'ler ve 1990'lardaki çalışmaları ise Edgeworth açılımları aracılığıyla bootstrap'ın daha yüksek dereceli doğruluğunu ortaya koymuştur.
Öne çıkan isimler
- Bradley Efron
- Robert Tibshirani
- Peter Hall
- Maurice Quenouille
İlgili konular
Temel eserler
- efron1979
Sıkça sorulan sorular
- Bootstrap, yoktan yeni bilgi mi yaratmaktadır?
- Hayır. Örnekleme değişkenliğini yaklaştırmak için örnekte zaten bulunan bilgiyi yeniden kullanmaktadır; kötü veya yanlı (biased) bir örneği iyileştiremez ve doğruluğu, orijinal örneğin popülasyonu iyi temsil etmesine bağlıdır.
- Bootstrap ne zaman başarısız olmaktadır?
- Dağılıma düzgün olmayan bir şekilde bağlı olan istatistikler için, örneğin örnek maksimumu veya bir sınır üzerindeki parametreler için başarısız olabilmektedir; bu gibi durumlarda alt örnekleme (subsampling) veya m-out-of-n bootstrap gibi değiştirilmiş şemalar kullanılmaktadır.