Ki-Kare ve Fisher Kesin Testleri
Ki-kare testi ve Fisher kesin testi, bir olumsallık tablosundaki iki kategorik değişkenin ilişkili olup olmadığını veya bağımsız olup olmadığını sorgulamak için kullanılan iki standart prosedürdür. Ki-kare testi, bağımsızlık varsayımı altında beklenen hücre sayıları ile gözlenen hücre sayılarını büyük örneklem yaklaşımı kullanarak karşılaştırmaktadır; Fisher kesin testi ise gözlenen tablonun olasılığını doğrudan hesaplamakta ve sayımların küçük olduğu durumlarda kullanılmaktadır.
Tanım
İlişki için ki-kare testi, bağımsızlık sıfır hipotezi altında gözlenen ve beklenen hücre sayıları arasındaki tutarsızlığı ölçmekte ve ortaya çıkan istatistiği bir ki-kare dağılımına atfetmektedir; Fisher kesin testi ise, kenar toplamları sabit tutularak hipergeometrik dağılımdan, gözlenenden daha aşırı veya gözlenen tabloların kesin olasılığını hesaplamaktadır.
Kapsam
Bu madde, Pearson'ın ki-kare istatistiğini ve serbestlik derecelerini, ki-kare yaklaşımını haklı çıkaran beklenen sayı koşulunu, süreklilik (Yates) düzeltmesini, hipergeometrik dağılıma dayalı Fisher kesin testinin mantığını ve kesin bir testin yaklaşıklık yerine ne zaman kullanılması gerektiği pratik sorusunu kapsamaktadır. Bu testler, klinik rehberlik olarak değil, ilişki testleri olarak sunulmaktadır ve bir ilişkinin var olup olmadığını değerlendirdiklerini, büyüklüğünü değil, belirtmektedir.
Temel sorular
- Bu tablodaki iki kategorik değişken bağımsız mıdır, yoksa bir ilişki kanıtı var mıdır?
- Ki-kare istatistiği gözlenen ve beklenen sayılardan nasıl oluşturulur ve kaç serbestlik derecesine sahiptir?
- Beklenen sayılar, ki-kare yaklaşımına güvenilemeyecek kadar ne zaman küçüktür?
- Fisher kesin testi, büyük örneklem yaklaşımından nasıl kaçınır ve “kenar toplamlarına koşullandırma” ne anlama gelmektedir?
Anahtar kavramlar
- Gözlenen ve beklenen sayılar
- Pearson ki-kare istatistiği
- Serbestlik dereceleri (r-1)(c-1)
- Büyük örneklem (asemptotik) yaklaşım
- Beklenen sayı genel kuralı
- Yates süreklilik düzeltmesi
- Hipergeometrik dağılım ve sabit kenar toplamları
- Kesin ve asemptotik p-değerleri
Mekanizmalar
Bağımsızlık varsayımı altında, her hücrenin beklenen sayısı, satır toplamının sütun toplamıyla çarpımının genel toplama bölünmesiyle elde edilmektedir. Pearson'ın ki-kare istatistiği, gözlenen ve beklenen sayılar arasındaki kare farkının beklenen sayıya bölünmesinin tüm hücreler üzerindeki toplamını ifade etmektedir; r×c boyutundaki bir tablo için bu istatistik, (r−1)(c−1) serbestlik derecesine sahip bir ki-kare dağılımıyla karşılaştırılmaktadır; bu serbestlik derecesi sonucu Fisher tarafından 1922'de açıklığa kavuşturulmuştur. Beklenen sayılar küçük olduğunda yaklaşım bozulmakta ve beklenen sayıların genellikle yaklaşık beşten fazla olması gerektiği yönünde yaygın bir kılavuz ortaya çıkmaktadır; Yates süreklilik düzeltmesi, 2×2 yaklaşımını iyileştirmek amacıyla önerilmiştir. Fisher kesin testi, satır ve sütun kenar toplamlarını sabit kabul ederek ve hipergeometrik dağılımdan, gözlenen tablonun ve daha aşırı her tablonun kesin olasılığını hesaplayarak, bunları bir p-değeri olarak toplayarak yaklaşımdan kaçınmaktadır. Kesin olduğu için seyrek tablolar için tercih edilmektedir, ancak incelemeler onun koşullu, muhafazakar doğasına dikkat çekmekte ve mevcut testler arasında belirli seçimler önermektedir.
Klinik önem
Bir çalışmanın bir maruziyetin bir sonuçla ilişkili olup olmadığını bildirmesi genellikle bu testlerden birine dayanmaktadır, bu nedenle ne işe yaradıklarını — ve küçük bir p-değerinin bir ilişkiyi işaret ettiğini ancak büyüklüğü hakkında hiçbir şey söylemediğini — anlamak, sağlık araştırmalarını değerlendirmenin bir parçasıdır. Bu testler, ilişki kanıtlarını değerlendirmek için araçlardır ve bireysel tanı veya tedavi kararları için bir temel oluşturmamaktadır.
Epidemiyoloji
Ki-kare ve Fisher kesin testleri, epidemiyoloji ve klinik araştırmalarda 2×2 ve daha büyük olumsallık tabloları için varsayılan anlamlılık testleridir ve aynı ilişkileri nicelendiren risk oranları ve olasılık oranları ile birlikte kullanılmaktadır. Kesin test, ki-kare yaklaşımının güvenilmez olduğu küçük örneklemler veya nadir olaylar için rutin olarak kullanılmaktadır.
Tarihçe
Karl Pearson, ki-kare uyum iyiliği istatistiğini 1900 yılında tanıtmıştır; Fisher'ın 1922 tarihli makalesi, olumsallık tabloları için serbestlik derecelerini düzeltmiş ve Fisher daha sonra küçük örneklemler için kendi adını taşıyan kesin testi geliştirmiştir. Yates, 1934'te 2×2 tablolar için süreklilik düzeltmesini önermiştir. Bu ve ilgili prosedürler arasındaki modern öneriler, metodolojik incelemelerde ve ders kitaplarında sentezlenmiştir.
Tartışmalar
- Küçük 2×2 tablolar için kesin ve asemptotik testler
- Fisher kesin testi her iki kenar toplamına da koşullanmakta ve kesin olmakla birlikte muhafazakar olma eğilimindedir; düzeltilmemiş ki-kare ise küçük örneklemler için anti-muhafazakar olabilmekte ve Yates düzeltmesi aşırı düzeltme yapabilmektedir; bu nedenle incelemeler tek bir kural yerine nüanslı öneriler sunmaktadır.
Öne çıkan isimler
- Karl Pearson
- Ronald A. Fisher
- Frank Yates
- Alan Agresti
İlgili konular
Temel eserler
- pearson-1900
- fisher-1922
- lydersen-2009
Sıkça sorulan sorular
- Fisher kesin testi, ki-kare testi yerine ne zaman kullanılmalıdır?
- Tablo küçük veya seyrek olduğunda — genellikle bir veya daha fazla beklenen hücre sayısı düşük olduğunda — ki-kare büyük örneklem yaklaşımı güvenilmez olabilmekte ve kesin bir olasılık hesaplayan Fisher kesin testi tercih edilmektedir.
- Anlamlı bir ki-kare testi, ilişkinin ne kadar güçlü olduğunu bana söyler mi?
- Hayır. Bu testler, bir ilişkinin kanıtı olup olmadığını göstermektedir; ilişkinin büyüklüğü, p-değeri ile birlikte rapor edilmesi gereken risk oranı veya olasılık oranı gibi ayrı bir etki ölçüsü ile iletilmektedir.