Distribusi Sampling dan Teorema Limit Pusat
Distribusi sampling adalah distribusi probabilitas dari suatu statistik, seperti rata-rata sampel, di antara semua kemungkinan sampel dengan ukuran tertentu. Teorema limit pusat menyatakan bahwa, untuk sampel yang cukup besar, distribusi sampling dari rata-rata adalah kira-kira normal terlepas dari bentuk data yang mendasarinya. Bersama-sama, keduanya menjelaskan mengapa interval kepercayaan dan uji berbasis normal berfungsi secara luas.
Definition
Distribusi sampling adalah distribusi nilai-nilai yang akan diambil oleh suatu statistik di antara semua kemungkinan sampel dengan ukuran tetap dari suatu populasi; teorema limit pusat menyatakan bahwa distribusi sampling dari rata-rata sampel mendekati distribusi normal seiring dengan peningkatan ukuran sampel, apa pun bentuk populasinya.
Scope
Entri ini mencakup konsep distribusi sampling, galat baku sebagai penyebarannya, teorema limit pusat dan peran ukuran sampel, serta perbedaan antara simpangan baku individu dan galat baku suatu statistik. Ini menghubungkan ide-ide ini dengan interval kepercayaan dan pengujian hipotesis. Ini adalah referensi metodologis dan bukan panduan klinis.
Core questions
- Apa itu distribusi sampling dari suatu statistik dan mengapa itu penting?
- Bagaimana galat baku berbeda dari simpangan baku?
- Apa yang dijamin oleh teorema limit pusat, dan dalam kondisi apa?
- Bagaimana ukuran sampel memengaruhi presisi suatu estimasi?
Key concepts
- Statistik versus parameter
- Distribusi sampling
- Galat baku
- Galat baku versus simpangan baku
- Ukuran sampel dan presisi
- Kenormalan perkiraan dari rata-rata
- Dasar interval kepercayaan dan uji
Key theories
- Teorema limit pusat
- Untuk observasi independen dari populasi dengan varians terbatas, distribusi rata-rata sampel cenderung menuju distribusi normal seiring dengan bertambahnya ukuran sampel, terlepas dari bentuk populasi; ini membenarkan inferensi berbasis normal untuk rata-rata bahkan ketika pengukuran individu tidak normal.
Mechanisms
Jika sampel berulang dengan ukuran yang sama diambil dari suatu populasi, statistik seperti rata-rata akan bervariasi dari sampel ke sampel; distribusi nilai-nilai tersebut adalah distribusi sampling, dan simpangan bakunya adalah galat baku. Untuk rata-rata sampel, galat baku sama dengan simpangan baku populasi dibagi dengan akar kuadrat dari ukuran sampel, sehingga presisi meningkat seiring dengan bertambahnya sampel tetapi hanya dengan akar kuadrat dari n. Teorema limit pusat menambahkan bahwa, untuk sampel yang cukup besar, distribusi sampling ini kira-kira normal bahkan ketika data itu sendiri miring (skewed), asalkan observasi bersifat independen dan variansnya terbatas. Ini adalah mesin inferensi klasik: interval kepercayaan untuk rata-rata dibangun dengan melangkah keluar sejumlah galat baku dari estimasi di bawah kenormalan perkiraan, dan banyak uji hipotesis membandingkan estimasi dengan distribusi samplingnya. Galat baku, yang menyusut dengan ukuran sampel, harus dibedakan dari simpangan baku observasi individu, yang mengestimasi penyebaran populasi dan tidak menyusut.
Clinical relevance
Interval kepercayaan dan nilai p yang dilaporkan dalam studi klinis dan kesehatan masyarakat bergantung pada distribusi sampling dari estimasi dan teorema limit pusat, sehingga memahaminya membantu menilai presisi efek yang dilaporkan. Entri ini adalah latar belakang metodologis dan bukan dasar untuk keputusan klinis individu.
History
Bentuk awal teorema limit pusat muncul dalam aproksimasi normal de Moivre terhadap binomial dan dalam karya Laplace sekitar tahun 1810, dan kondisi umum yang ketat ditetapkan oleh Lyapunov dan lainnya sekitar tahun 1900. Sudut pandang distribusi sampling menjadi sentral dalam inferensi pada awal abad kedua puluh dan tetap menjadi justifikasi standar untuk interval kepercayaan dan uji berbasis normal dalam biostatistik.
Debates
- Seberapa besar sampel harus agar teorema limit pusat dapat diterapkan?
- Aproksimasi meningkat dengan ukuran sampel, tetapi seberapa besar yang cukup bergantung pada seberapa miring (skewed) data; untuk distribusi yang sangat miring, sampel yang jauh lebih besar diperlukan sebelum distribusi rata-rata cukup normal, sehingga tidak ada aturan praktis tunggal yang cocok untuk semua kasus.
Key figures
- Pierre-Simon Laplace
- Abraham de Moivre
- Aleksandr Lyapunov
Related topics
Seminal works
- altman-bland-2005-se
- rosner-2015
Frequently asked questions
- Apa perbedaan antara simpangan baku dan galat baku?
- Simpangan baku mengukur penyebaran observasi individu, sedangkan galat baku mengukur penyebaran suatu statistik, seperti rata-rata sampel, di antara sampel; galat baku menurun seiring dengan bertambahnya ukuran sampel, sementara simpangan baku mengestimasi kuantitas populasi yang tetap.
- Mengapa kita dapat menggunakan distribusi normal untuk rata-rata bahkan ketika data miring (skewed)?
- Teorema limit pusat menyatakan bahwa distribusi sampling dari rata-rata menjadi kira-kira normal seiring dengan peningkatan ukuran sampel terlepas dari bentuk data, sehingga metode berbasis normal untuk rata-rata seringkali valid dengan sampel yang cukup besar bahkan ketika nilai-nilai individu tidak terdistribusi secara normal.