Deskripsi Data dan Statistik Ringkasan
Deskripsi data dan statistik ringkasan adalah bagian dari biostatistik yang berkaitan dengan pengorganisasian, pemadatan, dan penyajian sekumpulan observasi sehingga fitur-fitur esensialnya dapat dipahami secara sekilas. Sebelum inferensi apa pun dicoba, peneliti menjelaskan bagaimana data didistribusikan, di mana data terpusat, seberapa luas penyebarannya, dan bentuk apa yang diambilnya, menggunakan ringkasan numerik dan tampilan grafis.
Definition
Deskripsi data dan statistik ringkasan meliputi metode numerik dan grafis yang digunakan untuk mengkarakterisasi lokasi sentral, dispersi, bentuk distribusi, dan struktur kumpulan data, sebelum dan terlepas dari generalisasi inferensial ke populasi.
Scope
Area ini mengarahkan pembaca pada sisi deskriptif biostatistik: statistik deskriptif secara keseluruhan, distribusi dan normalitas data, ukuran tendensi sentral, ukuran variabilitas, dan visualisasi data. Ini adalah tinjauan referensi tentang bagaimana data kesehatan diringkas, bukan resep untuk analisis atau tindakan klinis.
Sub-topics
Core questions
- Di mana pusat data, dan ukuran lokasi mana yang paling baik mewakilinya?
- Seberapa banyak observasi bervariasi, dan bagaimana penyebaran tersebut dikuantifikasi?
- Bagaimana bentuk distribusinya, dan apakah kira-kira normal?
- Bagaimana data dapat ditampilkan sehingga pola, kemiringan, dan outlier-nya terlihat?
Key concepts
- Statistik deskriptif versus inferensial
- Ukuran tendensi sentral (mean, median, modus)
- Ukuran variabilitas (rentang, varians, deviasi standar, rentang interkuartil)
- Bentuk distribusi, kemiringan (skewness), dan kurtosis
- Normalitas dan penilaiannya
- Ringkasan grafis (histogram, box plot, scatter plot)
- Analisis data eksplorasi
Mechanisms
Deskripsi dilakukan dengan mereduksi banyak observasi menjadi beberapa kuantitas dan gambar yang informatif. Ukuran lokasi (mean, median, atau modus) meringkas di mana data berada; ukuran dispersi (deviasi standar, rentang interkuartil, rentang) meringkas seberapa jauh data menyebar di sekitar lokasi tersebut; dan pasangan lokasi dengan dispersi dipilih agar sesuai dengan bentuk distribusi, dengan median dan rentang interkuartil lebih disukai untuk data miring (skewed) dan mean serta deviasi standar untuk data yang kira-kira simetris. Tampilan grafis seperti histogram dan box plot mengungkapkan bentuk, kemiringan, dan outlier yang dapat disembunyikan oleh angka tunggal, dan bersama-sama alat-alat ini membentuk tahap eksplorasi yang mendahului inferensi formal.
Clinical relevance
Hampir setiap studi klinis, audit, dan laporan surveilans dimulai dengan ringkasan deskriptif partisipan dan pengukurannya, sehingga memahami ringkasan ini sangat mendasar untuk membaca literatur ilmu kesehatan. Area ini menjelaskan bagaimana data dikarakterisasi dan dimaksudkan sebagai latar belakang untuk penilaian bukti, bukan sebagai dasar untuk keputusan diagnostik atau pengobatan individu.
Epidemiology
Ringkasan deskriptif adalah langkah analitik pertama dalam penelitian epidemiologi dan klinis, digunakan untuk mengkarakterisasi populasi studi, tabel dasar, dan distribusi paparan serta hasil sebelum asosiasi diperkirakan. Pilihan ukuran ringkasan dan tampilan secara langsung memengaruhi seberapa transparan data studi dikomunikasikan.
History
Ringkasan numerik data memiliki akar yang dalam dalam astronomi abad kedelapan belas dan kesembilan belas serta statistik vital, tetapi perangkat deskriptif modern dikonsolidasikan pada abad kedua puluh. Exploratory Data Analysis (1977) karya John Tukey membingkai ulang deskripsi sebagai aktivitas investigasi tersendiri dan mempopulerkan tampilan seperti box plot, sementara pendidik statistik dalam ilmu kesehatan kemudian mengkodifikasi ringkasan standar yang sekarang dilaporkan dalam jurnal medis.
Debates
- Kapan mean dan deviasi standar harus diganti dengan median dan rentang interkuartil?
- Karena mean dan deviasi standar ditarik oleh kemiringan dan outlier, ada rekomendasi lama untuk meringkas data non-normal dengan median dan rentang interkuartil; ambang batas praktis untuk beralih bergantung pada bentuk distribusi dan ukuran sampel.
Key figures
- John W. Tukey
- William S. Cleveland
- Douglas G. Altman
- J. Martin Bland
Related topics
Seminal works
- tukey-1977
- gupta-2019
Frequently asked questions
- Apa perbedaan antara statistik deskriptif dan inferensial?
- Statistik deskriptif meringkas dan menampilkan data yang benar-benar dikumpulkan, sedangkan statistik inferensial menggunakan data tersebut untuk menarik generalisasi tentang populasi yang lebih luas. Deskripsi datang lebih dulu dan tidak membuat klaim probabilistik di luar sampel yang ada.
- Mengapa mendeskripsikan data sebelum menjalankan pengujian?
- Ringkasan dan plot mengungkapkan bentuk distribusi, penyebaran, dan setiap outlier atau kesalahan, yang menentukan apakah analisis selanjutnya sesuai dan bagaimana hasilnya harus diinterpretasikan.