Pembelajaran Mesin dan Analitik Prediktif dalam Perawatan Klinis
Pembelajaran mesin dan analitik prediktif menggunakan pola dalam data klinis dan kesehatan untuk memperkirakan probabilitas hasil, seperti diagnosis, perburukan kondisi, rawat inap kembali, atau respons terhadap pengobatan, untuk pasien individual. Topik ini mencakup bagaimana model prediksi klinis dikembangkan, divalidasi, dan dilaporkan, serta standar metodologis yang membedakan model yang dapat dipercaya dari yang menyesatkan.
Definition
Pembelajaran mesin klinis adalah penggunaan algoritma yang mempelajari hubungan statistik dari data pasien untuk memprediksi hasil yang relevan secara klinis; model prediksi klinis menggabungkan beberapa prediktor untuk memperkirakan probabilitas diagnosis (diagnostik) atau peristiwa di masa depan (prognostik) untuk seorang individu.
Scope
Entri ini mencakup pembelajaran terawasi untuk diagnosis dan prognosis, sumber data dan fitur yang digunakan dalam pengaturan klinis, konsep validasi sentral diskriminasi, kalibrasi, dan validasi eksternal, risiko bias dan overfitting, serta standar pelaporan dan penilaian seperti TRIPOD dan PROBAST. Ini membingkai pembelajaran mesin klinis sebagai topik metodologis, menjelaskan bagaimana alat prediktif dibangun dan dinilai daripada menawarkan rekomendasi klinis.
Key concepts
- Pembelajaran terawasi (diagnosis dan prognosis)
- Diskriminasi, kalibrasi, dan kegunaan klinis
- Validasi internal dan eksternal
- Overfitting dan optimisme
- Pergeseran kumpulan data (dataset shift) dan generalisasi
- Bias algoritmik dan keadilan
- Standar pelaporan (TRIPOD) dan penilaian risiko bias (PROBAST)
- Pembelajaran mendalam (deep learning) dan pembelajaran fitur
Mechanisms
Model prediksi klinis disesuaikan dengan data berlabel, mempelajari bagaimana prediktor berhubungan dengan hasil, dan kemudian dinilai untuk diskriminasi (seberapa baik ia memisahkan mereka yang mengalami dan tidak mengalami hasil) dan kalibrasi (seberapa baik probabilitas yang diprediksi cocok dengan frekuensi yang diamati). Karena model cenderung berkinerja optimis pada data yang melatihnya, validasi internal dan terutama eksternal pada populasi baru sangat penting, dan penerapan dapat terganggu oleh pergeseran kumpulan data (dataset shift) ketika pengaturan target berbeda dari pengaturan pengembangan (Rajkomar, 2019). Pembelajaran mendalam (deep learning) memperluas ide-ide ini dengan mempelajari fitur secara langsung dari input mentah seperti gambar, sinyal, atau teks, yang dapat meningkatkan kinerja pada tugas perseptual sambil mempersulit interpretasi (Esteva, 2019).
Clinical relevance
Model prediktif semakin banyak digunakan untuk skor risiko, peringatan dini, dan alat triase yang tertanam dalam sistem klinis, sehingga akurasi, kalibrasi, dan keadilannya secara langsung memengaruhi kualitas panduan yang diterima oleh klinisi. Entri ini menjelaskan bagaimana model tersebut dikembangkan dan dievaluasi; keluaran model adalah estimasi probabilistik yang memerlukan interpretasi dan pengawasan klinis, dan teks ini bukan dasar untuk keputusan diagnostik atau pengobatan individu apa pun.
Evidence & guidelines
Konsensus metodologis menekankan pengembangan yang transparan dan validasi yang ketat. Pernyataan TRIPOD menetapkan standar pelaporan untuk studi model prediksi sehingga metode dan kinerja dapat dinilai (Collins, 2015), dan PROBAST menyediakan alat terstruktur untuk menilai risiko bias dan penerapan dalam studi tersebut (Wolff, 2019). Tinjauan pembelajaran mesin dalam kedokteran menekankan validasi eksternal, kalibrasi, perhatian terhadap bias, dan kesenjangan antara kinerja retrospektif dan manfaat klinis prospektif (Rajkomar, 2019; Esteva, 2019).
History
Prediksi klinis memiliki akar panjang dalam skor risiko berbasis regresi, tetapi tahun 2010-an melihat pertumbuhan pesat pembelajaran mesin dan pembelajaran mendalam yang didukung oleh rekam medis elektronik, pencitraan, dan kumpulan data yang lebih besar. Bersamaan dengan ini muncul kekhawatiran yang meningkat tentang reproduktifitas, kinerja yang dilebih-lebihkan, dan bias, mendorong kerangka kerja pelaporan dan penilaian (TRIPOD, PROBAST) yang dimaksudkan untuk menjaga studi model sesuai dengan standar metodologis yang konsisten.
Debates
- Mengapa banyak model berkinerja lebih buruk dalam praktik daripada dalam studi pengembangan?
- Validasi eksternal yang tidak memadai, pergeseran kumpulan data antara pengaturan pengembangan dan penerapan, serta pelaporan yang optimis berarti bahwa kinerja retrospektif yang kuat seringkali gagal diterjemahkan menjadi manfaat klinis prospektif, memotivasi standar validasi dan pelaporan yang lebih ketat.
- Bagaimana seharusnya bias algoritmik dan keadilan ditangani?
- Model yang dilatih pada data historis dapat mengkodekan dan memperkuat disparitas, menimbulkan perdebatan tentang bagaimana mengukur keadilan, kapan perbedaan kinerja antar kelompok dapat diterima, dan bagaimana memantau model yang diterapkan untuk bias seiring waktu.
Key figures
- Alvin Rajkomar
- Gary S. Collins
- Karel G. M. Moons
- Isaac Kohane
Related topics
Seminal works
- rajkomar-2019
- collins-2015
- wolff-2019
Frequently asked questions
- Apa perbedaan antara diskriminasi dan kalibrasi?
- Diskriminasi adalah kemampuan model untuk memberi peringkat pasien sehingga mereka yang mengalami hasil mendapatkan risiko prediksi yang lebih tinggi daripada mereka yang tidak, sedangkan kalibrasi adalah kesesuaian antara probabilitas yang diprediksi dan frekuensi yang diamati; sebuah model dapat mendiskriminasi dengan baik namun terkalibrasi dengan buruk, sehingga keduanya penting.
- Mengapa validasi eksternal penting untuk model prediksi klinis?
- Model seringkali berkinerja optimis pada data yang digunakan untuk membangunnya; pengujian pada populasi dan pengaturan independen mengungkapkan seberapa baik model menggeneralisasi dan melindungi dari penerapan alat yang gagal ketika campuran kasus atau dokumentasi berbeda dari data pengembangan.