ScholarGate
Asisten

Analisis Data Kategorikal

Analisis data kategorikal adalah cabang biostatistik yang berkaitan dengan data yang termasuk dalam kategori diskrit, bukan mengambil nilai numerik kontinu — misalnya, suatu penyakit ada atau tidak, tumor bersifat jinak atau ganas, pasien ditugaskan ke salah satu dari beberapa kelompok perlakuan. Objek utamanya adalah tabel kontingensi frekuensi, dan metodenya menguji serta mengukur asosiasi antara variabel kategorikal sambil mengendalikan variabel lain.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Analisis data kategorikal adalah seperangkat metode statistik untuk mendeskripsikan, menguji, dan memodelkan asosiasi antar variabel yang nilainya adalah frekuensi dalam kategori diskrit yang tidak berurutan atau berurutan, biasanya diorganisasikan sebagai tabel kontingensi frekuensi.

Scope

Area ini mengarahkan pembaca pada ide-ide inti yang berulang di seluruh halaman topik di bawahnya: bagaimana observasi kategorikal disusun ke dalam tabel kontingensi, bagaimana asosiasi dalam tabel diuji (uji chi-kuadrat dan uji eksak), bagaimana asosiasi diringkas oleh ukuran efek (rasio risiko dan rasio odds), dan bagaimana variabel kategorikal pengganggu ditangani melalui stratifikasi (metode Mantel-Haenszel). Ini membingkai hal-hal tersebut sebagai alat metodologis untuk membaca dan menghasilkan penelitian kesehatan, bukan sebagai panduan klinis.

Sub-topics

Core questions

  • Apakah ada asosiasi antara dua variabel kategorikal, atau apakah keduanya independen?
  • Seberapa besar asosiasi tersebut, yang dinyatakan sebagai rasio atau perbedaan risiko atau odds?
  • Apakah asosiasi yang tampak tetap ada setelah stratifikasi pada variabel kategorikal ketiga, atau apakah asosiasi tersebut dikacaukan atau dimodifikasi olehnya?
  • Ketika frekuensi sel kecil, prosedur eksak mana yang menggantikan perkiraan sampel besar?

Key concepts

  • Tabel kontingensi frekuensi
  • Independensi variabel kategorikal
  • Uji asosiasi chi-kuadrat
  • Uji eksak untuk tabel jarang
  • Ukuran efek: rasio risiko dan rasio odds
  • Stratifikasi dan estimator Mantel-Haenszel
  • Confounding dan modifikasi efek antar strata
  • Model log-linear dan logistik untuk tabel

Mechanisms

Observasi kategorikal diklasifikasikan silang ke dalam tabel yang sel-selnya berisi frekuensi. Uji asosiasi membandingkan frekuensi sel yang diamati dengan yang diharapkan jika variabel baris dan kolom independen: statistik chi-kuadrat Pearson, yang dibenarkan secara asimtotik oleh klarifikasi Fisher tentang derajat kebebasannya, menjumlahkan perbedaan standar kuadrat, sementara uji eksak menghitung distribusi kondisional tabel ketika frekuensi terlalu kecil untuk perkiraan. Kekuatan asosiasi kemudian diringkas oleh ukuran efek yang berasal dari tabel — rasio risiko atau rasio odds. Ketika variabel ketiga berpotensi mengganggu asosiasi, data dibagi menjadi strata yang ditentukan oleh variabel tersebut dan estimasi gabungan dibentuk di seluruh strata; prosedur Mantel-Haenszel menyediakan uji terstratifikasi dan estimasi ringkasan semacam itu. Bagian-bagian ini digeneralisasi menjadi model regresi log-linear dan logistik yang menangani beberapa prediktor kategorikal sekaligus.

Clinical relevance

Sebagian besar bukti diagnostik, prognostik, dan faktor risiko dalam ilmu kesehatan dilaporkan sebagai asosiasi antara variabel kategorikal — terpapar versus tidak terpapar, kejadian versus tidak ada kejadian — sehingga metode di area ini mendasari bagaimana bukti tersebut dihasilkan dan dinilai. Metode ini menjelaskan bagaimana asosiasi diukur dan diuji; metode ini adalah alat untuk menafsirkan penelitian dan bukan dasar untuk keputusan diagnostik atau pengobatan individual.

Epidemiology

Metode tabel kontingensi adalah mekanisme sehari-hari epidemiologi: studi kohort, kasus-kontrol, dan potong lintang semuanya direduksi, pada bentuk paling sederhananya, menjadi tabel dua-kali-dua paparan terhadap hasil, dan analisis terstratifikasi (Mantel-Haenszel) adalah pendekatan non-model klasik untuk confounding sebelum regresi. Metode yang sama berulang dalam uji klinis yang melaporkan titik akhir biner dan dalam evaluasi uji diagnostik.

History

Bidang ini dimulai dengan statistik chi-kuadrat Karl Pearson pada awal abad kedua puluh dan koreksi Fisher pada tahun 1922 terhadap derajat kebebasannya untuk tabel kontingensi, diikuti oleh uji eksak Fisher untuk sampel kecil. Epidemiologi pertengahan abad menyediakan kerangka ukuran efek — argumen rasio odds Cornfield dan estimator terstratifikasi Mantel-Haenszel tahun 1959 — dan akhir abad kedua puluh menyatukan metode-metode ini dalam kerangka model linear umum, yang disintesis dalam perlakuan buku teks Agresti.

Key figures

  • Karl Pearson
  • Ronald A. Fisher
  • Jerome Cornfield
  • Nathan Mantel
  • William Haenszel
  • Alan Agresti
  • Joseph Fleiss

Related topics

Seminal works

  • fisher-1922
  • mantel-haenszel-1959
  • agresti-2013

Frequently asked questions

Apa yang membuat data disebut “kategorikal”?
Data bersifat kategorikal ketika setiap observasi termasuk dalam salah satu dari serangkaian kelas diskrit — seperti sakit/sehat atau kelompok perlakuan A/B/C — daripada mengambil nilai numerik terukur; analisis bekerja dengan frekuensi di setiap kelas.
Bagaimana area ini berbeda dari regresi untuk hasil kontinu?
Hasil di sini adalah kategori atau frekuensi, bukan pengukuran kontinu, sehingga metode berpusat pada tabel kontingensi, rasio risiko dan odds, serta model seperti regresi logistik dan log-linear daripada pada rata-rata dan regresi linear biasa.

Methods for this concept

Related concepts