การออกแบบและสถาปัตยกรรมคลังข้อมูลทางคลินิก
คลังข้อมูลทางคลินิกคือพื้นที่เก็บข้อมูลแบบบูรณาการที่เน้นการสอบถาม ซึ่งรวบรวมข้อมูลจากแหล่งข้อมูลธุรกรรมของระบบสุขภาพ เพื่อให้สามารถวิเคราะห์ได้โดยไม่รบกวนระบบการดูแลผู้ป่วยในการดำเนินงาน การออกแบบและสถาปัตยกรรมของคลังข้อมูลนี้เป็นตัวกำหนดวิธีการดึงข้อมูลต้นฉบับ การสร้างแบบจำลอง และการนำเสนอข้อมูลเพื่อการวิจัย การวัดคุณภาพ และการรายงานการดำเนินงาน
Definition
การออกแบบคลังข้อมูลทางคลินิกคือสถาปัตยกรรมและวิศวกรรมของพื้นที่เก็บข้อมูลแบบบูรณาการที่รวบรวมข้อมูลสุขภาพจากแหล่งปฏิบัติการหลายแหล่งเข้าสู่โครงสร้างที่เหมาะสมที่สุดสำหรับการสอบถาม การวิเคราะห์ และการนำกลับมาใช้ใหม่ มากกว่าเพื่อการดูแลผู้ป่วยแบบธุรกรรม
Scope
หัวข้อนี้ครอบคลุมรูปแบบสถาปัตยกรรมเบื้องหลังคลังข้อมูลทางคลินิก: การแยกการวิเคราะห์ออกจากระบบธุรกรรม, ท่อส่งข้อมูลแบบสกัด-แปลง-โหลด (ETL), การสร้างแบบจำลองเชิงมิติเทียบกับการสร้างแบบจำลองแบบนอร์มัลไลซ์, และการใช้แบบจำลองข้อมูลทั่วไปเพื่อให้การสอบถามสามารถนำไปใช้ได้หลายที่ หัวข้อนี้ถือว่าการออกแบบคลังข้อมูลเป็นเรื่องของสารสนเทศศาสตร์และวิศวกรรมข้อมูล ไม่ใช่คำแนะนำการดำเนินงานสำหรับแพลตฟอร์มใดแพลตฟอร์มหนึ่งโดยเฉพาะ
Key concepts
- การแยกภาระงานการวิเคราะห์และธุรกรรม (OLAP เทียบกับ OLTP)
- ท่อส่งข้อมูลแบบสกัด-แปลง-โหลด (ETL)
- การสร้างแบบจำลองเชิงมิติ (สตาร์สกีมาและสโนว์เฟลกสกีมา)
- การออกแบบคลังข้อมูลองค์กรแบบนอร์มัลไลซ์ (รูปแบบนอร์มัลฟอร์มที่สาม)
- แบบจำลองข้อมูลทั่วไป
- ดาต้ามาท
- เมทาดาต้าและสายข้อมูล
- มิติข้อมูลที่เปลี่ยนแปลงช้า
Mechanisms
ระบบปฏิบัติการ เช่น บันทึกสุขภาพอิเล็กทรอนิกส์ ได้รับการปรับให้เหมาะสมสำหรับธุรกรรมแต่ละรายการที่รวดเร็ว ซึ่งทำให้ไม่เหมาะกับการสอบถามเชิงวิเคราะห์ขนาดใหญ่ คลังข้อมูลทางคลินิกแก้ไขปัญหานี้โดยการดึงข้อมูลจากแหล่งเหล่านั้นเป็นระยะๆ แปลงและทำความสะอาดข้อมูล และโหลดข้อมูลเหล่านั้นเข้าสู่พื้นที่เก็บข้อมูลแยกต่างหากที่จัดโครงสร้างไว้สำหรับการวิเคราะห์ มีแนวคิดการออกแบบที่มีอิทธิพลสองประการที่ใช้ในการสร้างแบบจำลอง: แนวทางคลังข้อมูลองค์กรแบบนอร์มัลไลซ์ที่เกี่ยวข้องกับ Inmon และแนวทางสตาร์สกีมาเชิงมิติที่เกี่ยวข้องกับ Kimball ซึ่งจัดระเบียบข้อมูลเป็นตารางข้อเท็จจริงและตารางมิติเพื่อการรวมข้อมูลที่มีประสิทธิภาพ ในการตั้งค่าการวิจัย แพลตฟอร์มเช่น i2b2 จัดระเบียบข้อมูลผู้ป่วยรอบสตาร์สกีมาและออนโทโลยีที่ควบคุม เพื่อให้นักวิจัยสามารถสอบถามกลุ่มผู้ป่วยได้ การแมปคลังข้อมูลเข้ากับแบบจำลองข้อมูลทั่วไปช่วยให้สามารถเรียกใช้การสอบถามเดียวกันได้ในหลายสถาบัน
Clinical relevance
สถาปัตยกรรมของคลังข้อมูลทางคลินิกกำหนดว่าการวิเคราะห์ใดบ้างที่สามารถทำได้ และสามารถระบุกลุ่มผู้ป่วยได้อย่างน่าเชื่อถือเพียงใด ซึ่งส่งผลต่อการวัดคุณภาพและการวิจัยที่เป็นประโยชน์ต่อการดูแลผู้ป่วย การทำความเข้าใจการออกแบบคลังข้อมูลช่วยให้ผู้ใช้ตีความได้ว่าข้อมูลเชิงวิเคราะห์มาจากไหนและผ่านการแปลงอะไรมาบ้าง นี่คือคำอธิบายอ้างอิงของโครงสร้างพื้นฐานและไม่ได้ให้คำแนะนำทางคลินิกส่วนบุคคล
History
คลังข้อมูลปรากฏขึ้นในระบบสารสนเทศทั่วไปในช่วงปลายศตวรรษที่ 20 โดยมีแบบจำลององค์กรแบบนอร์มัลไลซ์ของ Inmon และแบบจำลองเชิงมิติของ Kimball เป็นกรอบการถกเถียงหลักในการออกแบบ การดูแลสุขภาพได้นำรูปแบบเหล่านี้มาใช้เมื่อมีการสะสมข้อมูลที่สามารถนำกลับมาใช้ใหม่ได้จากบันทึกอิเล็กทรอนิกส์ แพลตฟอร์มที่เน้นการวิจัยเช่น i2b2 ในปี 2010 ได้แสดงให้เห็นสถาปัตยกรรมคลังข้อมูลที่ปรับให้เหมาะกับการค้นหากลุ่มผู้ป่วยทางคลินิก และแบบจำลองข้อมูลทั่วไปได้กำหนดมาตรฐานการสอบถามข้ามสถาบันในภายหลัง
Debates
- คลังข้อมูลองค์กรแบบนอร์มัลไลซ์เทียบกับการสร้างแบบจำลองเชิงมิติ
- นักออกแบบมีความเห็นต่างกันว่าจะสร้างคลังข้อมูลองค์กรแบบบูรณาการที่นอร์มัลไลซ์ (ตามแนวคิดของ Inmon) ซึ่งจะนำไปสู่การสร้างดาต้ามาท หรือจะสร้างดาต้ามาทแบบสตาร์สกีมาเชิงมิติโดยตรง (ตามแนวคิดของ Kimball) การเลือกนี้เป็นการแลกเปลี่ยนระหว่างการบูรณาการและความยืดหยุ่นกับการสอบถามที่ง่ายและความเร็ว
Key figures
- William H. Inmon
- Ralph Kimball
- Shawn N. Murphy
- Isaac Kohane
Related topics
Seminal works
- inmon-2005
- kimball-ross-2013
- murphy-2010
Frequently asked questions
- ทำไมไม่เรียกใช้การวิเคราะห์โดยตรงบนฐานข้อมูลบันทึกสุขภาพอิเล็กทรอนิกส์?
- ระบบธุรกรรมได้รับการปรับแต่งสำหรับการอ่านและเขียนขนาดเล็กจำนวนมากที่สนับสนุนการดูแลผู้ป่วยแบบเรียลไทม์ ดังนั้นการสอบถามเชิงวิเคราะห์ขนาดใหญ่สามารถทำให้ระบบช้าลงและเสี่ยงต่อการส่งผลกระทบต่อการดำเนินงานทางคลินิก คลังข้อมูลจะแยกการวิเคราะห์ออกจากการส่งมอบการดูแลและจัดโครงสร้างข้อมูลสำหรับการสอบถามที่มีประสิทธิภาพ
- แบบจำลองข้อมูลทั่วไปคืออะไร และทำไมจึงสำคัญต่อการออกแบบคลังข้อมูล?
- แบบจำลองข้อมูลทั่วไปคือสกีมาและคำศัพท์ที่ใช้ร่วมกันซึ่งหลายสถาบันนำมาใช้สำหรับคลังข้อมูลของตน การแมปข้อมูลเข้ากับแบบจำลองนี้ช่วยให้สามารถเรียกใช้การสอบถามเชิงวิเคราะห์เดียวกันได้ในหลายสถานที่โดยไม่ต้องเขียนใหม่ ซึ่งสนับสนุนการวิจัยข้ามสถาบันและการทำซ้ำได้