क्लिनिकल डेटा वेयरहाउस डिज़ाइन और आर्किटेक्चर
एक क्लिनिकल डेटा वेयरहाउस एक एकीकृत, क्वेरी-उन्मुख रिपॉजिटरी है जो स्वास्थ्य प्रणाली के लेन-देन संबंधी स्रोतों से डेटा को समेकित करता है ताकि उन्हें परिचालन देखभाल प्रणालियों को बाधित किए बिना विश्लेषण किया जा सके। इसका डिज़ाइन और आर्किटेक्चर यह निर्धारित करता है कि स्रोत डेटा को अनुसंधान, गुणवत्ता माप और परिचालन रिपोर्टिंग के लिए कैसे निकाला, मॉडल किया और उजागर किया जाता है।
Definition
क्लिनिकल डेटा वेयरहाउस डिज़ाइन एकीकृत रिपॉजिटरी का आर्किटेक्चर और इंजीनियरिंग है जो कई परिचालन स्रोतों से स्वास्थ्य डेटा को एक ऐसी संरचना में समेकित करता है जो लेन-देन संबंधी देखभाल के बजाय क्वेरी, विश्लेषण और पुन: उपयोग के लिए अनुकूलित है।
Scope
यह विषय क्लिनिकल डेटा वेयरहाउस के पीछे के वास्तुशिल्प पैटर्न को शामिल करता है: विश्लेषणात्मक और लेन-देन संबंधी प्रणालियों का पृथक्करण, एक्सट्रैक्ट-ट्रांसफॉर्म-लोड (ETL) पाइपलाइन, आयामी बनाम सामान्यीकृत मॉडलिंग, और क्वेरी को पोर्टेबल बनाने के लिए सामान्य डेटा मॉडल का उपयोग। यह वेयरहाउस डिज़ाइन को एक सूचना विज्ञान और डेटा-इंजीनियरिंग विषय के रूप में मानता है, न कि किसी विशिष्ट प्लेटफॉर्म के लिए परिचालन निर्देशों के रूप में।
Key concepts
- विश्लेषणात्मक और लेन-देन संबंधी (OLAP बनाम OLTP) वर्कलोड का पृथक्करण
- एक्सट्रैक्ट-ट्रांसफॉर्म-लोड (ETL) पाइपलाइन
- आयामी मॉडलिंग (स्टार और स्नोफ्लेक स्कीमा)
- सामान्यीकृत (तीसरे-सामान्य-रूप) एंटरप्राइज़ वेयरहाउस डिज़ाइन
- सामान्य डेटा मॉडल
- डेटा मार्ट्स
- मेटाडेटा और डेटा वंशावली
- धीरे-धीरे बदलते आयाम
Mechanisms
इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड जैसी परिचालन प्रणालियाँ तेज़ व्यक्तिगत लेनदेन के लिए अनुकूलित होती हैं, जो उन्हें बड़े विश्लेषणात्मक प्रश्नों के लिए अनुपयुक्त बनाती हैं। एक क्लिनिकल डेटा वेयरहाउस उन स्रोतों से डेटा को समय-समय पर निकालकर, उन्हें परिवर्तित और साफ करके, और विश्लेषण के लिए संरचित एक अलग रिपॉजिटरी में लोड करके इसे संबोधित करता है। दो प्रभावशाली डिज़ाइन परंपराएँ मॉडलिंग परत को सूचित करती हैं: इनमोन से जुड़ा सामान्यीकृत एंटरप्राइज़-वेयरहाउस दृष्टिकोण, और किम्बल से जुड़ा आयामी स्टार-स्कीमा दृष्टिकोण, जो कुशल एकत्रीकरण के लिए डेटा को फैक्ट और आयाम तालिकाओं में व्यवस्थित करता है। अनुसंधान सेटिंग्स में, i2b2 जैसे प्लेटफ़ॉर्म रोगी डेटा को एक स्टार स्कीमा और एक नियंत्रित ऑन्टोलॉजी के आसपास व्यवस्थित करते हैं ताकि अन्वेषक कोहोर्ट्स पर क्वेरी कर सकें। वेयरहाउस को एक सामान्य डेटा मॉडल में मैप करने से एक ही क्वेरी को संस्थानों में चलाया जा सकता है।
Clinical relevance
एक क्लिनिकल डेटा वेयरहाउस का आर्किटेक्चर यह आकार देता है कि कौन से विश्लेषण संभव हैं और कोहोर्ट्स को कितनी मज़बूती से पहचाना जा सकता है, जो बदले में गुणवत्ता माप और देखभाल को सूचित करने वाले अनुसंधान को प्रभावित करता है। वेयरहाउस डिज़ाइन को समझना उपयोगकर्ताओं को यह व्याख्या करने में मदद करता है कि विश्लेषणात्मक डेटा कहाँ से आता है और उन्होंने किन परिवर्तनों से गुज़रा है। यह बुनियादी ढांचे का एक संदर्भ विवरण है और व्यक्तिगत नैदानिक मार्गदर्शन प्रदान नहीं करता है।
History
डेटा वेयरहाउसिंग बीसवीं शताब्दी के अंत में सामान्य सूचना प्रणालियों में उभरा, जिसमें इनमोन का सामान्यीकृत एंटरप्राइज़ मॉडल और किम्बल का आयामी मॉडल प्रमुख डिज़ाइन बहस को फ्रेम करते थे। स्वास्थ्य सेवा ने इन पैटर्न को अपनाया क्योंकि इलेक्ट्रॉनिक रिकॉर्ड ने पुन: प्रयोज्य डेटा जमा किया; 2010 में i2b2 जैसे अनुसंधान-उन्मुख प्लेटफार्मों ने क्लिनिकल कोहोर्ट खोज के लिए तैयार वेयरहाउस आर्किटेक्चर का प्रदर्शन किया, और सामान्य डेटा मॉडल ने बाद में अंतर-संस्थागत क्वेरी को मानकीकृत किया।
Debates
- सामान्यीकृत एंटरप्राइज़ वेयरहाउस बनाम आयामी मॉडलिंग
- डिजाइनर इस बात पर भिन्न होते हैं कि क्या एक सामान्यीकृत, एकीकृत एंटरप्राइज़ वेयरहाउस (इनमोन परंपरा) का निर्माण किया जाए जिससे डेटा मार्ट्स प्राप्त होते हैं, या सीधे आयामी स्टार-स्कीमा मार्ट्स (किम्बल परंपरा) का निर्माण किया जाए; यह विकल्प एकीकरण और लचीलेपन को क्वेरी की सरलता और गति के खिलाफ व्यापार करता है।
Key figures
- William H. Inmon
- Ralph Kimball
- Shawn N. Murphy
- Isaac Kohane
Related topics
Seminal works
- inmon-2005
- kimball-ross-2013
- murphy-2010
Frequently asked questions
- इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड डेटाबेस पर सीधे विश्लेषण क्यों नहीं चलाया जाता?
- लेन-देन संबंधी प्रणालियाँ कई छोटे रीड और राइट्स के लिए ट्यून की जाती हैं जो लाइव देखभाल का समर्थन करती हैं, इसलिए बड़ी विश्लेषणात्मक क्वेरी उन्हें धीमा कर सकती हैं और नैदानिक संचालन को प्रभावित करने का जोखिम उठा सकती हैं। एक डेटा वेयरहाउस विश्लेषण को देखभाल वितरण से अलग करता है और कुशल क्वेरी के लिए डेटा को संरचित करता है।
- एक सामान्य डेटा मॉडल क्या है और वेयरहाउस डिज़ाइन के लिए यह क्यों मायने रखता है?
- एक सामान्य डेटा मॉडल एक साझा स्कीमा और शब्दावली है जिसे कई संस्थान अपने वेयरहाउस के लिए अपनाते हैं। इसे मैप करने से एक ही विश्लेषणात्मक क्वेरी को बिना फिर से लिखे साइटों पर चलाया जा सकता है, जो बहु-संस्था अनुसंधान और पुनरुत्पादन क्षमता का समर्थन करता है।