Desain dan Arsitektur Gudang Data Klinis
Gudang data klinis adalah repositori terintegrasi yang berorientasi pada kueri yang mengonsolidasikan data dari sumber transaksional sistem kesehatan sehingga dapat dianalisis tanpa mengganggu sistem perawatan operasional. Desain dan arsitekturnya menentukan bagaimana data sumber diekstraksi, dimodelkan, dan diekspos untuk penelitian, pengukuran kualitas, dan pelaporan operasional.
Definition
Desain gudang data klinis adalah arsitektur dan rekayasa repositori terintegrasi yang mengonsolidasikan data kesehatan dari berbagai sumber operasional ke dalam struktur yang dioptimalkan untuk kueri, analisis, dan penggunaan kembali, bukan untuk perawatan transaksional.
Scope
Topik ini mencakup pola arsitektur di balik gudang data klinis: pemisahan analitik dari sistem transaksional, alur kerja ekstrak-transformasi-muat (ETL), pemodelan dimensional versus normalisasi, dan penggunaan model data umum untuk membuat kueri portabel. Ini memperlakukan desain gudang sebagai topik informatika dan rekayasa data, bukan sebagai instruksi operasional untuk platform tertentu.
Key concepts
- Pemisahan beban kerja analitik dan transaksional (OLAP vs OLTP)
- Alur kerja ekstrak-transformasi-muat (ETL)
- Pemodelan dimensional (skema bintang dan kepingan salju)
- Desain gudang perusahaan yang dinormalisasi (bentuk normal ketiga)
- Model data umum
- Data mart
- Metadata dan silsilah data
- Dimensi yang berubah secara perlahan
Mechanisms
Sistem operasional seperti rekam medis elektronik dioptimalkan untuk transaksi individual yang cepat, yang membuatnya kurang cocok untuk kueri analitik besar. Gudang data klinis mengatasi hal ini dengan secara berkala mengekstraksi data dari sumber-sumber tersebut, mengubah dan membersihkannya, serta memuatnya ke dalam repositori terpisah yang terstruktur untuk analisis. Dua tradisi desain yang berpengaruh menginformasikan lapisan pemodelan: pendekatan gudang perusahaan yang dinormalisasi yang terkait dengan Inmon, dan pendekatan skema bintang dimensional yang terkait dengan Kimball, yang mengatur data ke dalam tabel fakta dan dimensi untuk agregasi yang efisien. Dalam pengaturan penelitian, platform seperti i2b2 mengatur data pasien di sekitar skema bintang dan ontologi terkontrol sehingga peneliti dapat membuat kueri kohort. Pemetaan gudang ke model data umum memungkinkan kueri yang sama berjalan di berbagai institusi.
Clinical relevance
Arsitektur gudang data klinis membentuk analisis apa yang dapat dilakukan dan seberapa andal kohort dapat diidentifikasi, yang pada gilirannya memengaruhi pengukuran kualitas dan penelitian yang menginformasikan perawatan. Memahami desain gudang membantu pengguna menafsirkan dari mana data analitik berasal dan transformasi apa yang telah dialaminya. Ini adalah deskripsi referensi infrastruktur dan tidak memberikan panduan klinis individual.
History
Gudang data muncul dalam sistem informasi umum pada akhir abad kedua puluh, dengan model perusahaan normalisasi Inmon dan model dimensional Kimball membingkai perdebatan desain utama. Perawatan kesehatan mengadopsi pola-pola ini seiring dengan akumulasi data yang dapat digunakan kembali dari rekam medis elektronik; platform berorientasi penelitian seperti i2b2 pada tahun 2010 menunjukkan arsitektur gudang yang disesuaikan untuk penemuan kohort klinis, dan model data umum kemudian menstandardisasi kueri lintas institusi.
Debates
- Gudang perusahaan yang dinormalisasi versus pemodelan dimensional
- Para desainer berbeda pendapat apakah akan membangun gudang perusahaan yang dinormalisasi dan terintegrasi (tradisi Inmon) dari mana data mart diturunkan, atau membangun data mart skema bintang dimensional secara langsung (tradisi Kimball); pilihan ini mempertukarkan integrasi dan fleksibilitas dengan kesederhanaan dan kecepatan kueri.
Key figures
- William H. Inmon
- Ralph Kimball
- Shawn N. Murphy
- Isaac Kohane
Related topics
Seminal works
- inmon-2005
- kimball-ross-2013
- murphy-2010
Frequently asked questions
- Mengapa tidak menjalankan analitik langsung pada basis data rekam medis elektronik?
- Sistem transaksional disetel untuk banyak pembacaan dan penulisan kecil yang mendukung perawatan langsung, sehingga kueri analitik besar dapat memperlambatnya dan berisiko memengaruhi operasi klinis. Gudang data memisahkan analisis dari pemberian perawatan dan menyusun data untuk kueri yang efisien.
- Apa itu model data umum dan mengapa penting untuk desain gudang?
- Model data umum adalah skema dan kosakata bersama yang diadopsi oleh banyak institusi untuk gudang mereka. Pemetaan ke dalamnya memungkinkan kueri analitik yang sama berjalan di berbagai lokasi tanpa penulisan ulang, yang mendukung penelitian multi-institusi dan reproduktifitas.