Daya Statistik dan Ukuran Sampel
Daya statistik adalah probabilitas bahwa suatu penelitian akan mendeteksi suatu efek dengan ukuran tertentu ketika efek tersebut benar-benar ada – secara formal, satu dikurangi tingkat kesalahan Tipe II. Penentuan ukuran sampel adalah langkah perencanaan yang memilih berapa banyak partisipan yang dibutuhkan untuk mencapai daya target, mengingat ukuran efek yang diharapkan, tingkat signifikansi yang dipilih, dan variabilitas data. Bersama-sama, keduanya menentukan apakah suatu penelitian cukup besar untuk memberikan pertanyaan yang adil untuk dijawab.
Definition
Daya statistik adalah probabilitas bahwa suatu uji dengan benar menolak hipotesis nol yang salah (mendeteksi efek nyata dengan ukuran tertentu); penentuan ukuran sampel adalah perhitungan jumlah observasi yang diperlukan untuk mencapai daya target pada tingkat signifikansi tertentu untuk ukuran efek dan variabilitas yang diasumsikan.
Scope
Topik ini menjelaskan apa arti daya, empat kuantitas yang saling terkait dalam perhitungan daya (ukuran efek, tingkat signifikansi, daya, dan ukuran sampel), dan konsekuensi dari penelitian yang kurang berdaya. Ini disajikan sebagai metodologi referensi untuk perencanaan dan penilaian studi, bukan sebagai aturan keputusan klinis.
Core questions
- Seberapa besar kemungkinan penelitian ini mendeteksi efek yang dicari?
- Berapa banyak partisipan yang dibutuhkan untuk mencapai daya target?
- Bagaimana ukuran efek, variabilitas, dan tingkat signifikansi mendorong ukuran sampel?
- Apa yang salah ketika suatu penelitian kurang berdaya?
Key concepts
- Daya statistik (1 minus beta)
- Ukuran efek
- Tingkat signifikansi (alpha)
- Variabilitas dan standar deviasi
- Perhitungan ukuran sampel a priori
- Studi yang kurang berdaya
- Perbedaan klinis minimum yang penting
Mechanisms
Daya, tingkat signifikansi, ukuran efek, dan ukuran sampel saling terkait sehingga penetapan tiga di antaranya menentukan yang keempat. Untuk tingkat signifikansi tertentu, daya meningkat seiring dengan bertambahnya ukuran efek sebenarnya, menurunnya variabilitas, dan meningkatnya ukuran sampel. Perhitungan ukuran sampel membalikkan hubungan ini: dimulai dari ukuran efek yang diasumsikan (seringkali minimum yang layak dideteksi), tingkat signifikansi yang dipilih, dan daya target – secara konvensional 80% atau 90% – ini menyelesaikan jumlah observasi yang dibutuhkan. Kurangnya daya tidak hanya meningkatkan kemungkinan terlewatnya efek nyata (kesalahan Tipe II) tetapi juga membuat temuan signifikan lebih mungkin untuk dilebih-lebihkan atau salah, karena hanya estimasi besar, yang mungkin meningkat, yang melewati ambang batas dalam studi kecil.
Clinical relevance
Apakah suatu uji coba atau penelitian memiliki daya yang memadai membentuk bagaimana hasilnya harus dibaca: hasil yang tidak signifikan dari penelitian yang kurang berdaya sebagian besar tidak informatif daripada meyakinkan, dan justifikasi ukuran sampel secara prospektif adalah elemen yang diharapkan dari pelaporan studi. Entri ini menjelaskan penalaran daya dan ukuran sampel untuk tujuan penilaian dan desain dan bukan merupakan dasar untuk keputusan diagnostik atau pengobatan individu.
Evidence & guidelines
Standar pelaporan untuk uji klinis dan studi observasional mengharapkan justifikasi ukuran sampel a priori, dan tinjauan metodologis telah mendokumentasikan kerugian luas dari daya yang rendah. Button dan rekan-rekannya menunjukkan bahwa bidang-bidang yang secara kronis kurang berdaya menghasilkan literatur yang tidak dapat diandalkan, sementara Altman dan Bland serta panduan misinterpretasi oleh Greenland dan rekan-rekannya menekankan bahwa daya yang rendah menjelaskan banyak hasil nol yang tidak informatif.
History
Daya adalah hasil langsung dari kerangka pengujian Neyman-Pearson, yang mendefinisikan tingkat kesalahan Tipe II yang merupakan komplemen daya. Karya Jacob Cohen dari tahun 1960-an dan seterusnya, yang dikonsolidasikan dalam monografnya tahun 1988, mempopulerkan analisis daya sistematis dan konvensi ukuran efek di seluruh ilmu kesehatan dan perilaku. Kekhawatiran tentang penelitian yang kurang berdaya meningkat dalam perdebatan reproduktifitas tahun 2010-an.
Debates
- Konsekuensi dari kurangnya daya kronis
- Daya yang rendah secara persisten tidak hanya meningkatkan negatif palsu tetapi juga mengurangi probabilitas bahwa temuan yang signifikan secara statistik mencerminkan efek yang benar dan melebih-lebihkan ukuran dari yang dilaporkan, merusak keandalan seluruh literatur.
Key figures
- Jacob Cohen
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- John P. A. Ioannidis
Related topics
Seminal works
- cohen-1988
- button-2013
Frequently asked questions
- Apa itu daya statistik dalam istilah sederhana?
- Ini adalah kemungkinan bahwa suatu penelitian akan mendeteksi efek nyata dengan ukuran tertentu jika efek tersebut benar-benar ada. Daya yang lebih tinggi berarti peluang yang lebih baik untuk tidak melewatkan efek yang benar; daya 80% adalah target umum.
- Mengapa ukuran sampel sangat penting?
- Sampel yang lebih besar meningkatkan daya dan mempersempit presisi estimasi, sehingga suatu penelitian dapat secara andal mendeteksi efek yang dicari. Sampel yang terlalu kecil berisiko melewatkan efek nyata dan menghasilkan temuan signifikan yang dilebih-lebihkan.