İstatistiksel güç basitçe nedir?

Bir çalışmanın, belirli bir büyüklükteki gerçek bir etkiyi, bu etki gerçekten var olduğunda tespit etme şansıdır. Daha yüksek güç, gerçek bir etkiyi gözden kaçırmama şansının daha yüksek olduğu anlamına gelir; %80 güç yaygın bir hedeftir.

Örneklem büyüklüğü neden bu kadar önemlidir?

Daha büyük örneklemler gücü artırır ve tahminlerin kesinliğini daraltır, böylece bir çalışma aradığı etkiyi güvenilir bir şekilde tespit edebilir. Çok küçük bir örneklem hem gerçek etkileri gözden kaçırma hem de abartılı anlamlı bulgular üretme riskini taşır.

İstatistiksel Güç ve Örneklem Büyüklüğü

İstatistiksel güç, bir çalışmanın belirli bir büyüklükteki etkiyi, bu etki gerçekten var olduğunda tespit etme olasılığıdır; resmi olarak, Tip II hata oranının birden çıkarılmasıyla elde edilir. Örneklem büyüklüğü belirlemesi, beklenen etki büyüklüğü, seçilen anlamlılık düzeyi ve verilerin değişkenliği göz önüne alındığında, hedeflenen gücü elde etmek için kaç katılımcıya ihtiyaç duyulduğunu seçen planlama adımıdır. Bunlar birlikte, bir çalışmanın sorusuna adil bir cevap şansı verecek kadar büyük olup olmadığına karar vermektedir.

PaperMind ile konu bulYakındaMakale ve konu bul

Tools & resources

Slaytları indir

Learn & explore

VideoYakında

Tanım

İstatistiksel güç, bir testin yanlış bir boş hipotezi doğru bir şekilde reddetme (belirli büyüklükteki gerçek bir etkiyi tespit etme) olasılığıdır; örneklem büyüklüğü belirlemesi ise, varsayılan bir etki büyüklüğü ve değişkenlik için belirli bir anlamlılık düzeyinde hedeflenen gücü elde etmek için gereken gözlem sayısının hesaplanmasıdır.

Kapsam

Bu konu, gücün ne anlama geldiğini, bir güç hesaplamasının dört birbiriyle ilişkili niceliğini (etki büyüklüğü, anlamlılık düzeyi, güç ve örneklem büyüklüğü) ve gücü yetersiz araştırmanın sonuçlarını açıklamaktadır. Çalışmaları planlama ve değerlendirme için bir referans metodolojisi olarak sunulmakta olup, klinik bir karar kuralı olarak ele alınmamaktadır.

Temel sorular

Çalışma, aradığı etkiyi ne kadar olası bir şekilde tespit edebilir?
Hedeflenen güce ulaşmak için kaç katılımcıya ihtiyaç vardır?
Etki büyüklüğü, değişkenlik ve anlamlılık düzeyi örneklem büyüklüğünü nasıl etkiler?
Bir çalışma gücü yetersiz olduğunda neler yanlış gider?

Anahtar kavramlar

İstatistiksel güç (1 eksi beta)
Etki büyüklüğü
Anlamlılık düzeyi (alfa)
Değişkenlik ve standart sapma
A priori örneklem büyüklüğü hesaplaması
Gücü yetersiz çalışma
Minimum klinik olarak önemli fark

Mekanizmalar

Güç, anlamlılık düzeyi, etki büyüklüğü ve örneklem büyüklüğü birbirine bağlıdır, öyle ki herhangi üçünün sabitlenmesi dördüncüyü belirlemektedir. Belirli bir anlamlılık düzeyi için, gerçek etki büyüklüğü arttıkça, değişkenlik azaldıkça ve örneklem büyüklüğü arttıkça güç yükselmektedir. Örneklem büyüklüğü hesaplaması bu ilişkiyi tersine çevirmektedir: varsayılan bir etki büyüklüğünden (genellikle tespit edilmeye değer minimum bir değer), seçilen bir anlamlılık düzeyinden ve hedeflenen bir güçten (geleneksel olarak %80 veya %90) başlayarak, gereken gözlem sayısını çözmektedir. Gücün yetersiz olması sadece gerçek etkileri gözden kaçırma olasılığını (Tip II hata) artırmakla kalmaz, aynı zamanda anlamlı bulguların abartılma veya yanlış olma olasılığını da yükseltir, çünkü küçük bir çalışmada eşiği ancak büyük, muhtemelen şişirilmiş tahminler aşabilmektedir.

Klinik önem

Bir deneme veya çalışmanın yeterince güçlü olup olmadığı, sonuçlarının nasıl okunması gerektiğini şekillendirmektedir: gücü yetersiz bir çalışmadan elde edilen anlamsız bir sonuç, güven verici olmaktan ziyade büyük ölçüde bilgilendirici değildir ve örneklem büyüklüğünün önceden gerekçelendirilmesi, çalışma raporlamasının beklenen bir unsurudur. Bu madde, değerlendirme ve tasarım amaçları için güç ve örneklem büyüklüğü mantığını tanımlamakta olup, bireysel tanı veya tedavi kararları için bir temel oluşturmamaktadır.

Kanıt ve kılavuzlar

Klinik araştırmalar ve gözlemsel çalışmalar için raporlama standartları, önceden (a priori) bir örneklem büyüklüğü gerekçelendirmesi beklemektedir ve metodolojik derlemeler, düşük gücün yaygın zararlarını belgelemiştir. Button ve arkadaşları, kronik olarak gücü yetersiz alanların güvenilmez literatürler ürettiğini göstermiş, Altman ve Bland ile Greenland ve arkadaşlarının yanlış yorumlama kılavuzu ise düşük gücün birçok bilgilendirici olmayan boş sonucu açıkladığını vurgulamaktadır.

Tarihçe

Güç, tamamlayıcısı olduğu Tip II hata oranını tanımlayan Neyman-Pearson test çerçevesinin doğrudan bir sonucudur. Jacob Cohen'in 1960'lardan itibaren yaptığı ve 1988 tarihli monografisinde pekiştirdiği çalışmaları, sağlık ve davranış bilimleri genelinde sistematik güç analizini ve etki büyüklüğü konvansiyonlarını yaygınlaştırmıştır. Gücü yetersiz araştırmalarla ilgili endişe, 2010'lu yıllardaki tekrarlanabilirlik tartışmalarında yoğunlaşmıştır.

Tartışmalar

Kronik gücün yetersizliğinin sonuçları: Sürekli düşük güç, sadece yanlış negatifleri artırmakla kalmaz, aynı zamanda istatistiksel olarak anlamlı bir bulgunun gerçek bir etkiyi yansıtma olasılığını azaltır ve rapor edilenlerin büyüklüğünü abartarak tüm literatürlerin güvenilirliğini zayıflatır.

Öne çıkan isimler

Jacob Cohen
Jerzy Neyman
Egon Pearson
Douglas G. Altman
John P. A. Ioannidis

İlgili konular

Temel eserler

cohen-1988
button-2013

Sıkça sorulan sorular

İstatistiksel güç basitçe nedir?: Bir çalışmanın, belirli bir büyüklükteki gerçek bir etkiyi, bu etki gerçekten var olduğunda tespit etme şansıdır. Daha yüksek güç, gerçek bir etkiyi gözden kaçırmama şansının daha yüksek olduğu anlamına gelir; %80 güç yaygın bir hedeftir.
Örneklem büyüklüğü neden bu kadar önemlidir?: Daha büyük örneklemler gücü artırır ve tahminlerin kesinliğini daraltır, böylece bir çalışma aradığı etkiyi güvenilir bir şekilde tespit edebilir. Çok küçük bir örneklem hem gerçek etkileri gözden kaçırma hem de abartılı anlamlı bulgular üretme riskini taşır.