स्वास्थ्य डेटा प्रबंधन और विश्लेषण
स्वास्थ्य डेटा प्रबंधन और विश्लेषण में यह शामिल है कि स्वास्थ्य डेटा को कैसे व्यवस्थित किया जाता है, शासित किया जाता है और गुणवत्ता-सुनिश्चित किया जाता है, और फिर नैदानिक, परिचालन और जनसंख्या-स्वास्थ्य निर्णयों का समर्थन करने के लिए उनका विश्लेषण कैसे किया जाता है। इसमें डेटा वेयरहाउसिंग और शासन से लेकर वर्णनात्मक रिपोर्टिंग, भविष्य कहनेवाला मॉडलिंग और बड़े नैदानिक डेटासेट पर मशीन लर्निंग के उपयोग तक सब कुछ शामिल है।
Definition
स्वास्थ्य डेटा प्रबंधन और विश्लेषण स्वास्थ्य डेटा को एकत्र करने, एकीकृत करने, शासित करने और गुणवत्ता-सुनिश्चित करने और नैदानिक, परिचालन और जनसंख्या-स्वास्थ्य निर्णयों को सूचित करने के लिए - वर्णनात्मक रूप से, भविष्य कहनेवाला रूप से, या मशीन लर्निंग के माध्यम से - उसका विश्लेषण करने के लिए प्रथाओं का एक समूह है।
Scope
यह विषय डेटा प्रबंधन के मूलभूत सिद्धांतों जैसे एकीकरण, शासन और गुणवत्ता को शामिल करता है; वर्णनात्मक से भविष्य कहनेवाला तरीकों तक विश्लेषणात्मक स्पेक्ट्रम; और स्वास्थ्य डेटा पर बड़े डेटा और मशीन लर्निंग तकनीकों को लागू करने के अवसर और सीमाएं। इसे एक वैचारिक संदर्भ के रूप में तैयार किया गया है; यह किसी विशिष्ट सेटिंग के लिए विशेष उपकरणों, मॉडलों या विश्लेषणात्मक निर्णयों का समर्थन नहीं करता है और कोई नैदानिक सलाह नहीं देता है।
Core questions
- विश्लेषण से पहले स्वास्थ्य डेटा को कैसे एकीकृत, शासित और गुणवत्ता-सुनिश्चित किया जाता है?
- वर्णनात्मक रिपोर्टिंग से भविष्य कहनेवाला विश्लेषण तक का स्पेक्ट्रम क्या है?
- मशीन लर्निंग और बड़े डेटा के तरीके स्वास्थ्य में क्या योगदान दे सकते हैं, और उनकी सीमाएं क्या हैं?
- नैदानिक डेटा से विश्लेषणात्मक मॉडल को कैसे मान्य और जिम्मेदारी से व्याख्या किया जाता है?
Key concepts
- डेटा शासन और प्रबंधन
- डेटा गुणवत्ता और पूर्णता
- डेटा एकीकरण और वेयरहाउसिंग
- वर्णनात्मक, भविष्य कहनेवाला और निर्देशात्मक विश्लेषण
- नैदानिक डेटा पर मशीन लर्निंग
- जोखिम भविष्यवाणी मॉडल
- मॉडल सत्यापन और सामान्यीकरण
Mechanisms
विश्लेषण सबसे पहले प्रबंधन पर निर्भर करता है: कई स्रोतों से डेटा को एकीकृत किया जाता है, शासित किया जाता है और गुणवत्ता और पूर्णता के लिए मूल्यांकन किया जाता है, क्योंकि विश्लेषण अपने इनपुट के पूर्वाग्रहों और अंतरालों को विरासत में लेता है। विश्लेषणात्मक तरीके तब वर्णनात्मक सारांश, भविष्य कहनेवाला मॉडल और मशीन-लर्निंग दृष्टिकोणों को शामिल करते हैं जो बड़े डेटासेट से पैटर्न सीखते हैं। नियमित रूप से एकत्र किए गए नैदानिक डेटा से निर्मित मॉडल आवर्ती पद्धतिगत चुनौतियों का सामना करते हैं - गुम डेटा, भ्रम (confounding), और सीमित बाहरी सत्यापन - इसलिए सामान्यीकरण और सावधानीपूर्वक व्याख्या पर जोर दिया जाता है। मशीन लर्निंग जटिल पैटर्न का पता लगा सकती है लेकिन अपने आप में कारण स्थापित नहीं करती है या यह सुनिश्चित नहीं करती है कि एक मॉडल नई आबादी में स्थानांतरित हो जाए।
Clinical relevance
स्वास्थ्य डेटा पर विश्लेषण गुणवत्ता माप, संसाधन योजना और जोखिम स्तरीकरण को सूचित कर सकता है, और तेजी से निर्णय-समर्थन उपकरणों को फीड करता है। यह प्रविष्टि संदर्भ सामग्री के रूप में विधियों और उनकी सीमाओं का वर्णन करती है; यह विशिष्ट मॉडलों या विश्लेषणात्मक कार्यों की सिफारिश नहीं करती है, और विश्लेषणात्मक आउटपुट नैदानिक निर्णय का विकल्प नहीं हैं।
Evidence & guidelines
यहां साक्ष्य पद्धतिगत और वैचारिक है: बड़े डेटा के अनुप्रयोग पर टिप्पणियां, चिकित्सा में मशीन लर्निंग की कथा समीक्षाएं, और रिकॉर्ड डेटा से भविष्यवाणी-मॉडल विकास की व्यवस्थित समीक्षाएं। ये कार्य नैदानिक दिशानिर्देशों की पेशकश करने के बजाय डेटा गुणवत्ता, सत्यापन और सावधानीपूर्वक व्याख्या पर लगातार जोर देते हैं।
History
स्वास्थ्य विश्लेषण प्रशासनिक रिपोर्टिंग और रजिस्ट्रियों से एकीकृत डेटा वेयरहाउस की ओर बढ़ा और, इलेक्ट्रॉनिक रिकॉर्ड के प्रसार के साथ, बड़े पुन: प्रयोज्य नैदानिक डेटासेट की ओर बढ़ा। 2010 के दशक में टिप्पणियों ने स्वास्थ्य सेवा में बड़े डेटा के अनिवार्य अनुप्रयोग की उम्मीद की, और बाद की समीक्षाओं ने मशीन लर्निंग के वादे और डेटा गुणवत्ता, सत्यापन और सामान्यीकरण की आवर्ती समस्याओं दोनों को मैप किया जो इसे बाधित करते हैं।
Debates
- क्या नियमित नैदानिक डेटा पर प्रशिक्षित मॉडलों पर विभिन्न सेटिंग्स में भरोसा किया जा सकता है?
- भविष्य कहनेवाला और मशीन-लर्निंग मॉडल अक्सर विकास में अच्छा प्रदर्शन करते हैं लेकिन डेटा कैप्चर, केस मिक्स और गुणवत्ता में अंतर के कारण नई आबादी में खराब हो जाते हैं; समीक्षक बाहरी सत्यापन और बड़े डेटा विश्लेषण की अति-व्याख्या के खिलाफ सावधानी बरतने पर जोर देते हैं।
Key figures
- Isaac Kohane
- Andrew Beam
- Ziad Obermeyer
- Alvin Rajkomar
- Benjamin Goldstein
Related topics
Seminal works
- murdoch-2013
- beam-2018
- rajkomar-2019
Frequently asked questions
- स्वास्थ्य विश्लेषण में डेटा गुणवत्ता पर इतना जोर क्यों दिया जाता है?
- विश्लेषण अपने स्रोत डेटा के अंतरालों और पूर्वाग्रहों को विरासत में लेता है, इसलिए अपूर्ण, असंगत, या खराब शासित डेटा भ्रामक परिणाम उत्पन्न कर सकता है, चाहे विश्लेषणात्मक विधि कितनी भी परिष्कृत क्यों न हो।
- क्या मशीन लर्निंग नैदानिक या महामारी विज्ञान तर्क को प्रतिस्थापित करता है?
- नहीं; मशीन लर्निंग जटिल पैटर्न ढूंढ सकती है लेकिन कारण स्थापित नहीं करती है या नई आबादी में स्थानांतरण की गारंटी नहीं देती है, इसलिए यह सत्यापन, कारण तर्क और नैदानिक निर्णय को प्रतिस्थापित करने के बजाय पूरक करती है।