Penilaian Kritis dan Evaluasi Bukti Individual
Penilaian kritis adalah proses terstruktur untuk secara sistematis menguji satu bagian penelitian guna menilai validitasnya, ukuran dan presisi hasilnya, serta relevansinya terhadap pertanyaan tertentu. Ini adalah keterampilan praktis yang mengubah kegiatan membaca studi menjadi mengevaluasi studi, dan ini merupakan inti dari praktik berbasis bukti: sebelum bukti dapat diterapkan atau disintesis, setiap studi harus terlebih dahulu dinilai berdasarkan ketentuannya sendiri.
Definition
Penilaian kritis adalah evaluasi eksplisit berbasis kriteria terhadap studi penelitian individual untuk menentukan keandalan metodenya (validitas internal), makna dan presisi temuannya, serta sejauh mana temuan tersebut dapat diterapkan pada pengaturan atau populasi lain (validitas eksternal).
Scope
Area ini mengarahkan pembaca pada cara mengevaluasi studi individual daripada cara menggabungkan kumpulan bukti. Ini mencakup pertanyaan penilaian umum (apakah valid? apa hasilnya? apakah dapat diterapkan?), alat dan daftar periksa terstruktur yang digunakan untuk menerapkan pertanyaan-pertanyaan tersebut, dan standar pelaporan (seperti CONSORT dan STROBE) yang membuat studi cukup transparan untuk dinilai sejak awal. Ini bersifat referensi-edukasi dan tidak memberikan rekomendasi klinis.
Sub-topics
Core questions
- Apakah hasil dari studi individual ini valid, mengingat bagaimana studi ini dirancang dan dilakukan?
- Apa hasilnya, dan seberapa presisi serta penting secara klinis atau praktis hasilnya?
- Dapatkah hasilnya diterapkan pada populasi, pengaturan, atau pertanyaan yang ada?
- Bagaimana alat terstruktur dan standar pelaporan membuat studi dapat dinilai dan mengurangi penilaian subjektif?
Key concepts
- Validitas internal
- Validitas eksternal (generalisabilitas)
- Risiko bias
- Kerangka penilaian validitas-hasil-penerapan
- Standar pelaporan versus kualitas metodologis
- Alat dan daftar periksa penilaian kritis
- Reproduksibilitas dan transparansi pelaporan
Mechanisms
Penilaian dilakukan dengan memetakan desain studi ke bias yang rentan terhadap desain tersebut, kemudian menanyakan apakah penulis mengambil langkah-langkah yang memadai untuk mengatasinya. Kerangka kerja Panduan Pengguna yang diajarkan secara luas mengorganisasikan ini menjadi tiga pertanyaan berurutan — apakah hasilnya valid, apa hasilnya, dan apakah akan membantu secara lokal — sehingga penilaian validitas mendahului interpretasi ukuran efek, yang pada gilirannya mendahului penilaian apa pun tentang penerapan (Guyatt 1993; Greenhalgh 1997). Berbeda dari penilaian metode, standar pelaporan menentukan apa yang harus diungkapkan oleh sebuah makalah agar pembaca memiliki informasi yang diperlukan untuk menilainya sama sekali; keduanya saling melengkapi, karena studi yang dilakukan dengan baik tetapi dilaporkan dengan buruk tidak dapat dinilai, dan studi yang dilaporkan secara transparan masih dapat dinilai berisiko tinggi bias.
Clinical relevance
Penilaian kritis adalah kompetensi inti praktik berbasis bukti di seluruh profesi kesehatan, karena penerapan penelitian secara bertanggung jawab memerlukan penilaian terlebih dahulu apakah suatu studi dapat dipercaya dan relevan. Area ini menjelaskan bagaimana studi individual dievaluasi dan dilaporkan; ini mengkarakterisasi bukti daripada meresepkan keputusan diagnostik atau pengobatan, dan ini bukan pengganti pedoman klinis.
Evidence & guidelines
Penilaian didukung oleh instrumen yang tervalidasi dan spesifik desain daripada satu daftar periksa universal; tinjauan sistematis menemukan variabilitas yang luas di antara lebih dari seratus alat yang diterbitkan tanpa standar emas yang disepakati untuk desain apa pun (Katrak 2004). Standar pelaporan yang didukung oleh jurnal dan Jaringan EQUATOR — CONSORT untuk uji coba acak dan STROBE untuk studi observasional — melengkapi penilaian dengan menstandardisasi pengungkapan, sementara kerangka kerja seperti GRADE memperluas penilaian dari studi tunggal ke kepastian kumpulan bukti (Guyatt 2008).
History
Penilaian kritis terstruktur tumbuh dari epidemiologi klinis yang dikembangkan di Universitas McMaster dan gerakan kedokteran berbasis bukti pada tahun 1990-an. Definisi kedokteran berbasis bukti oleh Sackett dan rekan-rekannya membingkai penilaian studi individual sebagai keterampilan klinis rutin (Sackett 1996), dan seri JAMA Users' Guides mengkodifikasi pertanyaan penilaian eksplisit dan berurutan untuk setiap jenis studi (Guyatt 1993). Primer Greenhalgh yang banyak dibaca membawa pendekatan yang sama kepada audiens klinis yang luas (Greenhalgh 1997). Secara paralel, standar pelaporan dan alat penilaian khusus berkembang pesat dari akhir 1990-an dan seterusnya, yang akhirnya dikoordinasikan melalui Jaringan EQUATOR.
Debates
- Apakah kualitas pelaporan mengukur kualitas studi?
- Standar pelaporan mendokumentasikan apa yang diungkapkan, bukan apakah studi dilakukan dengan baik; memperlakukan kepatuhan terhadap daftar periksa pelaporan sebagai ukuran kualitas metodologis menyamakan transparansi dengan validitas, dan sebagian besar penulis standar memperingatkan agar tidak menggunakannya sebagai skor kualitas.
- Apakah ada alat penilaian standar emas?
- Banyaknya daftar periksa yang bersaing, dengan sedikit tumpang tindih dalam konten dan tidak ada instrumen referensi yang disepakati untuk desain apa pun, membuat penilaian sebagian bergantung pada alat yang dipilih dan pada penilaian peninjau.
Key figures
- David Sackett
- Gordon Guyatt
- Trisha Greenhalgh
- Andrew Oxman
Related topics
Seminal works
- sackett-1996
- guyatt-1993
- greenhalgh-1997
Frequently asked questions
- Bagaimana penilaian kritis berbeda dari sintesis bukti?
- Penilaian kritis mengevaluasi satu studi pada satu waktu, menilai validitas dan relevansinya. Sintesis bukti menggabungkan temuan dari banyak studi yang telah dinilai; penilaian setiap studi individual adalah langkah prasyarat dalam sintesis.
- Apakah mengikuti daftar periksa pelaporan sama dengan menilai sebuah studi?
- Tidak. Standar pelaporan memberi tahu Anda apakah sebuah studi mengungkapkan informasi yang cukup; penilaian menggunakan informasi tersebut untuk menilai apakah metode dan hasil studi dapat dipercaya dan diterapkan. Studi yang dilaporkan sepenuhnya masih dapat berisiko tinggi bias.