Merkezi Eğilim Ölçüleri
Merkezi eğilim ölçüleri, bir veri setinin büyük bir kısmının nerede yer aldığını özetleyen tek değerlerdir; diğer gözlemlerin etrafında kümelendiği tipik veya merkezi gözlemi ifade ederler. Üç klasik ölçü aritmetik ortalama, medyan ve moddur ve bunlar arasından seçim yapmak, ölçüm düzeyine ve dağılımın şekline bağlıdır.
Tanım
Merkezi eğilim ölçüsü, bir dağılımın merkezini tanımlayan tek bir değerdir: aritmetik ortalama, değerlerin toplamının sayısına bölünmesiyle elde edilir; medyan, gözlemler sıralandığında ortadaki değerdir; ve mod, en sık görülen değerdir.
Kapsam
Bu girdi, aritmetik ortalama, medyan ve modu ele almaktadır: her birinin nasıl hesaplandığı, neyi temsil ettiği ve her birinin konumun uygun bir özeti olarak ne zaman kullanıldığı incelenmektedir. Bu, metodolojik bir referanstır ve klinik rehberlik sağlamamaktadır.
Temel sorular
- Konumun hangi ölçüsü bu değişkeni en iyi temsil etmektedir?
- Dağılım şekli, aritmetik ortalama ve medyan arasındaki seçimi nasıl etkilemektedir?
- Mod, en bilgilendirici özetleyici ne zaman olmaktadır?
Anahtar kavramlar
- Aritmetik ortalama
- Medyan
- Mod
- Aykırı değerlere karşı sağlamlık (robustness)
- Çarpıklığın (skewness) aritmetik ortalama ve medyan üzerindeki etkisi
- Ölçüm düzeyi ve ortalama seçimi
Mekanizmalar
Aritmetik ortalama, her gözlemi kullanır ve simetrik, aralık veya oran ölçekli veriler için doğal bir özetleyicidir; ancak tüm değerleri içermesi nedeniyle aşırı gözlemlere doğru çekilmekte ve çarpıklık (skew) ve aykırı değerler (outliers) tarafından bozulabilmektedir. Sıralanmış verinin orta değeri olan medyan, aşırı değerlerin büyüklüğünü göz ardı eder ve bu nedenle sağlamdır (robust); bu da onu çarpık sürekli veriler ve sıralı değişkenler için tercih edilen bir özetleyici yapmaktadır. En yaygın değer olan mod, nominal verilere uygulanabilen tek ölçüdür ve en tipik kategoriyi veya dağılımdaki bir tepe noktasını belirlemek için faydalıdır. Mükemmel simetrik tek modlu bir dağılımda üçü çakışır; çarpıklık arttıkça, aritmetik ortalama kuyruk yönünde en uzağa kaymaktadır.
Klinik önem
Bildirilen ortalamalar — ortalama kan basıncı, medyan sağkalım, en yaygın tanı — klinik bulguların nasıl iletildiğinin merkezinde yer almaktadır ve hangi ölçünün kullanıldığını bilmek, çarpık verilerin yanlış okunmasına karşı koruma sağlamaktadır. Bu girdi, konumun değerlendirme için nasıl özetlendiğini açıklamaktadır ve bireysel tanı veya tedavi kararları için bir temel oluşturmamaktadır.
Epidemiyoloji
Birçok sağlık ölçümü çarpık olduğundan, medyan genellikle tipik bir değerin daha doğru bir özetidir ve bu tür veriler için aritmetik ortalama bildirmek, merkezi değeri abartabilmektedir. Bu nedenle, ölçü seçimi, popülasyon özelliklerinin ve sonuçlarının nasıl aktarıldığını etkilemektedir.
Tarihçe
Aritmetik ortalama, ölçümleri birleştirmek için antik çağlardan beri kullanılmaktadır ve aritmetik ortalama, medyan ve mod arasındaki resmi ayrım, tanımlayıcı istatistiklerin on dokuzuncu ve yirminci yüzyıl başlarında olgunlaşmasıyla pekişmiştir. Medyanın çarpık dağılımları daha iyi temsil ettiği anlayışı, uygulamalı istatistik literatüründe tekrarlanan köklü bir ilkedir.
Tartışmalar
- Çarpık klinik veriler için aritmetik ortalama mı, medyan mı?
- Tıp alanında yaygın olan sağa çarpık nicelikler — maliyetler, hastanede kalış süreleri, biyobelirteç düzeyleri — için aritmetik ortalama kuyruk tarafından şişirilirken, medyan tipik değeri takip etmektedir; bu nedenle rehberlik genellikle medyanı desteklemekte, aritmetik ortalama ise kabaca simetrik veriler için saklı tutulmaktadır.
Öne çıkan isimler
- S. Manikandan
İlgili konular
Temel eserler
- manikandan-2011-mean
- manikandan-2011-median-mode
Sıkça sorulan sorular
- Medyan, aritmetik ortalama yerine ne zaman bildirilmelidir?
- Dağılım çarpık olduğunda veya aykırı değerler içerdiğinde ya da değişken sıralı (ordinal) olduğunda. Bu durumlarda medyan, tipik değeri, aşırı değerlere doğru çekilen aritmetik ortalamadan daha doğru bir şekilde temsil etmektedir.
- Mod, herhangi bir veri türü için kullanılabilir mi?
- Evet. Mod, nominal (kategorik) verilere uygulanan tek merkezi eğilim ölçüsüdür ve sayısal verilerdeki tepe noktalarını veya en yaygın değeri de vurgulayabilmektedir.