Güven Aralıkları
Güven aralığı, bilinmeyen bir popülasyon niceliği için olası değerlerin bir aralığıdır; örneklem verilerinden hesaplanmaktadır, öyle ki onu oluşturmak için kullanılan prosedür, tekrarlanan örneklemler boyunca belirtilen bir oranda (geleneksel olarak %95) gerçek değeri yakalayabilmektedir. Tek bir, yaygın olarak raporlanan özette hem bir tahminin büyüklüğünü hem de etrafındaki belirsizliği ifade etmektedir ve sağlık bilimlerinde etki tahminlerini sunmak için tercih edilen bir yöntem haline gelmiştir.
Tanım
Güven aralığı, örneklem verilerinden belirli bir güven düzeyinde tanımlanmış bir yöntemle hesaplanan bir aralıktır, öyle ki bu yöntem varsayımsal tekrarlanan örneklemlerin belirtilen oranında gerçek popülasyon parametresini içerebilmektedir.
Kapsam
Bu konu, güven aralığının ne olduğunu, güven düzeyinin nasıl yorumlanması gerektiğini, aralık genişliğinin kesinliği ve örneklem büyüklüğünü nasıl yansıttığını ve kavramın yaygın olarak yanlış anlaşıldığı yolları açıklamaktadır. Bu, araştırmayı değerlendirmek ve raporlamak için bir referans metodolojisi olarak sunulmaktadır, klinik bir karar kuralı olarak değil.
Temel sorular
- Parametre için hangi değer aralığı verilerle makul bir şekilde tutarlıdır?
- Güven düzeyi aslında neyi garanti etmektedir?
- Örneklem büyüklüğü ve değişkenlik aralık genişliğini nasıl belirlemektedir?
- Güven aralığı bir hipotez testi veya p-değeri ile nasıl ilişkilidir?
Anahtar kavramlar
- Güven düzeyi
- Kapsama olasılığı
- Aralık genişliği ve kesinlik
- Alt ve üst güven sınırları
- Frekansçı yorum
- Sıfır değeriyle ilişki
- Kesin ve yaklaşık aralıklar
Mekanizmalar
Bir güven aralığı tipik olarak bir nokta tahmini alınarak ve bu tahminin standart hatasının bir katıyla genişletilerek oluşturulmaktadır; burada bu kat, istenen güven düzeyi ve ilgili örnekleme dağılımı tarafından belirlenmektedir. Tanımlayıcı frekansçı özellik kapsayıcılıktır: eğer çalışma birçok kez tekrarlansaydı, bu şekilde oluşturulan aralıklar, tekrarların belirtilen oranında gerçek parametreyi içerebilirdi. Aralık, örneklem büyüdükçe veya değişkenlik azaldıkça daralmaktadır, bu nedenle genişlik, kesinliğin doğrudan bir göstergesidir. Yaygın bir kısayol, aralıkları testlerle ilişkilendirmektedir – eğer bir fark için %95'lik bir aralık sıfır değerini dışlıyorsa, ilgili iki taraflı test %5 düzeyinde anlamlıdır – ancak aralık, uyumlu değerlerin tüm aralığını göstererek daha fazlasını iletmektedir. Sık yapılan bir hata, düzeyi, gerçek değerin belirli bir aralığın içinde yer alma olasılığı olarak okumaktır ki frekansçı tanım bunu desteklememektedir.
Klinik önem
Güven aralıkları, klinik ve epidemiyolojik raporlardaki çoğu etki tahminine eşlik etmektedir; okuyucuların sadece bir etkinin mevcut olup olmadığını değil, aynı zamanda ne kadar büyük ve ne kadar hassas bir şekilde tahmin edildiğini de değerlendirmelerine olanak tanımaktadır. Geniş bir aralık, bir nokta tahmini çarpıcı görünse bile sonuçsuz bir çalışmaya işaret etmektedir. Bu madde, aralıkların nasıl oluşturulduğunu ve yorumlandığını açıklamaktadır ve bireysel tanı veya tedavi kararları için bir temel teşkil etmemektedir.
Kanıt ve kılavuzlar
Tıpta raporlama kılavuzları ve editoryal gelenekler artık etki tahminlerinin güven aralıklarıyla birlikte sunulmasını rutin olarak beklemektedir. Amerikan İstatistik Derneği'nin p-değerleri hakkındaki bildirisi ve Greenland ile meslektaşlarının yanlış yorumlama kılavuzu, p-değerlerinin yanı sıra aralıkların doğru yorumlanmasını vurgulamaktadır; bu, Gardner ve Altman'ın aralık tabanlı raporlama konusundaki önceki savunuculuğuna dayanmaktadır.
Tarihçe
Güven aralığı, 1930'larda Jerzy Neyman tarafından aralık tahmini için frekansçı bir yaklaşım olarak tanıtılmıştır; binom oranları için Clopper-Pearson limitleri gibi erken dönem kesin yapılar 1934'te ortaya çıkmıştır. Tıpta rutin kullanımı yirminci yüzyılın sonlarında yaygınlaşmıştır, özellikle Gardner ve Altman'ın 1986'da sadece p-değerleri yerine aralıkların raporlanması yönündeki savunuculuğuyla, bu da dergi geleneklerini yeniden şekillendirmiştir.
Tartışmalar
- Güven düzeyinin yanlış yorumlanması
- Güven düzeyi, aralık oluşturma prosedürünün uzun vadeli performansını tanımlamaktadır, belirli bir hesaplanmış aralığın gerçek değeri içerdiği olasılığını değil; bu ayrım yaygın olarak yanlış anlaşılmakta ve tekrarlayan bir hata kaynağı olmaktadır.
Öne çıkan isimler
- Jerzy Neyman
- Egon Pearson
- Martin J. Gardner
- Douglas G. Altman
- Sander Greenland
İlgili konular
Temel eserler
- clopper-pearson-1934
- gardner-altman-1986
Sıkça sorulan sorular
- Bir %95 güven aralığı, gerçek değerin aralık içinde olma olasılığının %95 olduğu anlamına mı gelmektedir?
- Hayır. Frekansçı tanıma göre gerçek değer sabittir ve %95, tekrarlanan örneklemler boyunca aynı şekilde oluşturulan bu tür aralıkların, gerçek değeri içerecek uzun vadeli oranını ifade etmektedir – belirli bir tek bir aralık için olasılığı değil.
- Bir güven aralığını dar veya geniş yapan nedir?
- Başlıca örneklem büyüklüğü ve değişkenliktir: daha büyük örneklemler ve daha az değişken veriler daha dar, daha kesin aralıklar vermektedir, küçük veya gürültülü çalışmalar ise belirsizliğe işaret eden geniş aralıklar üretmektedir.