Mengapa normalitas itu penting?

Banyak ringkasan umum (rata-rata, standar deviasi) dan uji (uji-t, ANOVA) mengasumsikan data yang kira-kira normal; ketika asumsi itu gagal, ukuran-ukuran tersebut dapat menyesatkan dan alternatif non-parametrik atau yang ditransformasi mungkin lebih sesuai.

Apakah uji Shapiro-Wilk yang signifikan cukup menjadi alasan untuk meninggalkan metode parametrik?

Tidak dengan sendirinya. Uji ini menjadi sangat sensitif pada sampel besar dan kurang bertenaga pada sampel kecil, sehingga ukuran penyimpangan, bentuk yang terlihat pada plot Q-Q, dan ketahanan analisis yang direncanakan harus dipertimbangkan.

Distribusi Data dan Normalitas

Distribusi suatu variabel menjelaskan bagaimana nilai-nilainya tersebar di seluruh rentang kemungkinan, dan banyak metode deskriptif serta inferensial bergantung pada bentuk distribusi tersebut. Normalitas — apakah data mengikuti distribusi normal yang simetris dan berbentuk lonceng — adalah asumsi distribusi yang paling sering diperiksa dalam penelitian kesehatan, karena mengatur pilihan antara ringkasan dan uji parametrik dan non-parametrik.

Temukan Topik dengan PaperMindSegeraFind papers & topics

Tools & resources

Unduh salindia

Learn & explore

VideoSegera

Definition

Distribusi statistik menjelaskan frekuensi relatif atau probabilitas nilai-nilai yang mungkin dari suatu variabel; normalitas mengacu pada kesesuaian dengan distribusi Gaussian (normal), suatu bentuk simetris berbentuk lonceng yang dinilai secara grafis dan dengan uji formal untuk memutuskan apakah metode parametrik sesuai.

Scope

Entri ini mencakup bentuk distribusi (simetri, kemiringan, kurtosis), distribusi normal dan mengapa itu penting, serta bagaimana normalitas dinilai melalui inspeksi grafis dan uji formal. Ini adalah referensi metodologis dan tidak memberikan panduan klinis.

Core questions

Bentuk apa yang diambil oleh distribusi variabel, dan apakah simetris atau miring?
Apakah asumsi normalitas masuk akal untuk variabel ini?
Alat grafis dan formal mana yang paling baik menilai normalitas, dan bagaimana perilakunya dengan sampel kecil atau besar?

Key concepts

Distribusi normal (Gaussian)
Kemiringan dan kurtosis
Penilaian grafis (histogram, plot Q-Q)
Uji Shapiro-Wilk
Uji Kolmogorov-Smirnov
Pilihan parametrik versus non-parametrik
Sensitivitas ukuran sampel dari uji normalitas

Key theories

Teorema limit pusat: Teorema limit pusat menyatakan bahwa, untuk sampel yang cukup besar, distribusi sampling dari rata-rata mendekati distribusi normal terlepas dari bentuk variabel yang mendasarinya. Ini adalah alasan mengapa metode teori normal seringkali tetap berguna untuk rata-rata bahkan ketika data mentah tidak normal.

Mechanisms

Normalitas dinilai dengan dua cara yang saling melengkapi. Metode grafis — histogram dan plot kuantil-kuantil (Q-Q) — menunjukkan penyimpangan seperti kemiringan, ekor tebal, atau bimodalitas secara langsung. Uji formal, di mana uji Shapiro-Wilk adalah salah satu yang paling banyak digunakan, mengembalikan probabilitas pengamatan data di bawah model normal. Karena uji ini memperoleh kekuatan dengan ukuran sampel, uji ini cenderung menandai penyimpangan sepele dalam sampel besar dan melewatkan penyimpangan yang berarti dalam sampel kecil, sehingga inspeksi grafis dan konsekuensi praktis dari non-normalitas dipertimbangkan bersama dengan hasil uji apa pun. Ketika kuantitas yang menarik adalah rata-rata, teorema limit pusat sering kali membenarkan metode teori normal bahkan untuk data mentah yang tidak normal.

Clinical relevance

Apakah suatu biomarker, lama rawat inap, atau skor diperlakukan sebagai normal menentukan bagaimana ringkasan dan analisisnya di seluruh literatur klinis, sehingga menilai normalitas adalah bagian dari penilaian metode suatu penelitian. Entri ini menjelaskan penilaian asumsi distribusi dan bukan merupakan dasar untuk keputusan diagnostik atau pengobatan individu.

Epidemiology

Banyak pengukuran biologis dan klinis cenderung miring ke kanan (misalnya, kadar hormon, biaya, dan waktu tunggu), sehingga normalitas tidak dapat diasumsikan dan secara rutin diperiksa. Keputusan ini membentuk apakah hasil dilaporkan dengan rata-rata dan standar deviasi atau dengan median dan rentang, dan apakah uji parametrik atau non-parametrik digunakan.

History

Distribusi normal dikembangkan pada abad kedelapan belas dan kesembilan belas dalam karya de Moivre, Laplace, dan Gauss, dan menjadi pusat statistik melalui teori kesalahan dan teorema limit pusat. Alat formal untuk memeriksa asumsi tersebut menyusul pada abad kedua puluh, dengan uji analisis varians Shapiro dan Wilk tahun 1965 untuk normalitas menjadi prosedur standar dalam pekerjaan terapan.

Debates

Haruskah normalitas dinilai dengan uji formal atau dengan inspeksi grafis?: Uji normalitas formal sensitif terhadap ukuran sampel — menolak penyimpangan sepele dalam sampel besar dan gagal mendeteksi penyimpangan penting dalam sampel kecil — sehingga banyak metodolog menyarankan agar penilaian grafis dan ketahanan praktis dari analisis yang direncanakan memandu keputusan daripada hanya nilai p dari suatu uji.

Key figures

Samuel S. Shapiro
Martin B. Wilk
Carl Friedrich Gauss

Seminal works

shapiro-wilk-1965
kwak-2017
ghasemi-2012

Frequently asked questions

Mengapa normalitas itu penting?: Banyak ringkasan umum (rata-rata, standar deviasi) dan uji (uji-t, ANOVA) mengasumsikan data yang kira-kira normal; ketika asumsi itu gagal, ukuran-ukuran tersebut dapat menyesatkan dan alternatif non-parametrik atau yang ditransformasi mungkin lebih sesuai.
Apakah uji Shapiro-Wilk yang signifikan cukup menjadi alasan untuk meninggalkan metode parametrik?: Tidak dengan sendirinya. Uji ini menjadi sangat sensitif pada sampel besar dan kurang bertenaga pada sampel kecil, sehingga ukuran penyimpangan, bentuk yang terlihat pada plot Q-Q, dan ketahanan analisis yang direncanakan harus dipertimbangkan.