क्लिनिकल देखभाल में मशीन लर्निंग और प्रेडिक्टिव एनालिटिक्स
मशीन लर्निंग और प्रेडिक्टिव एनालिटिक्स व्यक्तिगत रोगियों के लिए निदान, बिगड़ना, पुन: प्रवेश, या उपचार के प्रति प्रतिक्रिया जैसे परिणामों की संभावना का अनुमान लगाने के लिए क्लिनिकल और स्वास्थ्य डेटा में पैटर्न का उपयोग करते हैं। यह विषय बताता है कि क्लिनिकल प्रेडिक्शन मॉडल कैसे विकसित, मान्य और रिपोर्ट किए जाते हैं, और कार्यप्रणाली संबंधी मानक जो विश्वसनीय मॉडल को भ्रामक मॉडल से अलग करते हैं।
Definition
क्लिनिकल मशीन लर्निंग उन एल्गोरिदम का उपयोग है जो चिकित्सकीय रूप से प्रासंगिक परिणामों की भविष्यवाणी करने के लिए रोगी डेटा से सांख्यिकीय संबंध सीखते हैं; एक क्लिनिकल प्रेडिक्शन मॉडल एक व्यक्ति के लिए निदान (नैदानिक) या भविष्य की घटना (पूर्वानुमानित) की संभावना का अनुमान लगाने के लिए कई भविष्यवाणियों को जोड़ता है।
Scope
यह प्रविष्टि निदान और पूर्वानुमान के लिए पर्यवेक्षित शिक्षण (supervised learning), क्लिनिकल सेटिंग्स में उपयोग किए जाने वाले डेटा स्रोतों और विशेषताओं, भेदभाव (discrimination), अंशांकन (calibration) और बाहरी सत्यापन (external validation) की केंद्रीय सत्यापन अवधारणाओं, पूर्वाग्रह और अति-अनुकूलन (overfitting) के जोखिमों, और TRIPOD और PROBAST जैसे रिपोर्टिंग और मूल्यांकन मानकों को शामिल करती है। यह क्लिनिकल मशीन लर्निंग को एक कार्यप्रणाली संबंधी विषय के रूप में प्रस्तुत करता है, जिसमें यह बताया गया है कि भविष्य कहनेवाला उपकरण कैसे बनाए और परखे जाते हैं, न कि क्लिनिकल सिफारिशें प्रदान करते हैं।
Key concepts
- पर्यवेक्षित शिक्षण (निदान और पूर्वानुमान)
- भेदभाव, अंशांकन और क्लिनिकल उपयोगिता
- आंतरिक और बाहरी सत्यापन
- अति-अनुकूलन और आशावाद
- डेटासेट शिफ्ट और सामान्यीकरण
- एल्गोरिथम पूर्वाग्रह और निष्पक्षता
- रिपोर्टिंग मानक (TRIPOD) और पूर्वाग्रह के जोखिम का मूल्यांकन (PROBAST)
- डीप लर्निंग और फीचर लर्निंग
Mechanisms
एक क्लिनिकल प्रेडिक्शन मॉडल को लेबल किए गए डेटा पर फिट किया जाता है, यह सीखता है कि भविष्यवाणियां किसी परिणाम से कैसे संबंधित हैं, और फिर भेदभाव (यह कितनी अच्छी तरह उन लोगों को अलग करता है जो परिणाम का अनुभव करते हैं और नहीं करते हैं) और अंशांकन (भविष्यवाणी की गई संभावनाएं देखी गई आवृत्तियों से कितनी अच्छी तरह मेल खाती हैं) के लिए मूल्यांकन किया जाता है। क्योंकि मॉडल उन डेटा पर आशावादी रूप से प्रदर्शन करते हैं जिन्होंने उन्हें प्रशिक्षित किया है, नए आबादी पर आंतरिक और विशेष रूप से बाहरी सत्यापन आवश्यक हैं, और जब लक्ष्य सेटिंग विकास सेटिंग से भिन्न होती है तो डेटासेट शिफ्ट (dataset shift) द्वारा परिनियोजन को कमजोर किया जा सकता है (राजकुमार, 2019)। डीप लर्निंग छवियों, संकेतों या पाठ जैसे कच्चे इनपुट से सीधे सुविधाओं को सीखकर इन विचारों का विस्तार करता है, जो व्याख्यात्मकता को जटिल करते हुए अवधारणात्मक कार्यों पर प्रदर्शन में सुधार कर सकता है (एस्टेवा, 2019)।
Clinical relevance
प्रेडिक्टिव मॉडल तेजी से क्लिनिकल प्रणालियों में एम्बेडेड जोखिम स्कोर, प्रारंभिक चेतावनी अलर्ट और ट्राइएज टूल को फीड करते हैं, इसलिए उनकी सटीकता, अंशांकन और निष्पक्षता सीधे उन मार्गदर्शन की गुणवत्ता को प्रभावित करती है जो चिकित्सकों को प्राप्त होता है। यह प्रविष्टि बताती है कि ऐसे मॉडल कैसे विकसित और मूल्यांकन किए जाते हैं; मॉडल आउटपुट संभाव्य अनुमान हैं जिनके लिए क्लिनिकल व्याख्या और निरीक्षण की आवश्यकता होती है, और यह पाठ किसी भी व्यक्तिगत नैदानिक या उपचार निर्णय का आधार नहीं है।
Evidence & guidelines
कार्यप्रणाली संबंधी सहमति पारदर्शी विकास और कठोर सत्यापन पर जोर देती है। TRIPOD स्टेटमेंट प्रेडिक्शन-मॉडल अध्ययनों के लिए रिपोर्टिंग मानक निर्धारित करता है ताकि तरीकों और प्रदर्शन का मूल्यांकन किया जा सके (कॉलिन, 2015), और PROBAST ऐसे अध्ययनों में पूर्वाग्रह के जोखिम और प्रयोज्यता का न्याय करने के लिए एक संरचित उपकरण प्रदान करता है (वोल्फ, 2019)। चिकित्सा में मशीन लर्निंग की समीक्षा बाहरी सत्यापन, अंशांकन, पूर्वाग्रह पर ध्यान और पूर्वव्यापी प्रदर्शन और संभावित क्लिनिकल लाभ के बीच के अंतर पर जोर देती है (राजकुमार, 2019; एस्टेवा, 2019)।
History
क्लिनिकल प्रेडिक्शन की जड़ें लंबे समय से प्रतिगमन-आधारित जोखिम स्कोर में हैं, लेकिन 2010 के दशक में इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड, इमेजिंग और बड़े डेटासेट द्वारा पोषित मशीन लर्निंग और डीप लर्निंग में तेजी से वृद्धि देखी गई। इसके साथ ही प्रजनन क्षमता, अतिरंजित प्रदर्शन और पूर्वाग्रह के बारे में बढ़ती चिंता भी आई, जिससे रिपोर्टिंग और मूल्यांकन ढांचे (TRIPOD, PROBAST) को बढ़ावा मिला, जिसका उद्देश्य मॉडल अध्ययनों को सुसंगत कार्यप्रणाली मानकों पर रखना था।
Debates
- विकास अध्ययनों की तुलना में व्यवहार में कई मॉडल खराब प्रदर्शन क्यों करते हैं?
- अपर्याप्त बाहरी सत्यापन, विकास और परिनियोजन सेटिंग्स के बीच डेटासेट शिफ्ट, और आशावादी रिपोर्टिंग का मतलब है कि मजबूत पूर्वव्यापी प्रदर्शन अक्सर संभावित क्लिनिकल लाभ में परिवर्तित होने में विफल रहता है, जिससे सख्त सत्यापन और रिपोर्टिंग मानकों को प्रेरित किया जाता है।
- एल्गोरिथम पूर्वाग्रह और निष्पक्षता को कैसे संभाला जाना चाहिए?
- ऐतिहासिक डेटा पर प्रशिक्षित मॉडल असमानताओं को एन्कोड और बढ़ा सकते हैं, जिससे इस बात पर बहस छिड़ जाती है कि निष्पक्षता को कैसे मापा जाए, समूहों में प्रदर्शन अंतर कब स्वीकार्य हैं, और समय के साथ पूर्वाग्रह के लिए तैनात मॉडल की निगरानी कैसे की जाए।
Key figures
- Alvin Rajkomar
- Gary S. Collins
- Karel G. M. Moons
- Isaac Kohane
Related topics
Seminal works
- rajkomar-2019
- collins-2015
- wolff-2019
Frequently asked questions
- भेदभाव और अंशांकन में क्या अंतर है?
- भेदभाव एक मॉडल की रोगियों को रैंक करने की क्षमता है ताकि जो लोग परिणाम का अनुभव करते हैं उन्हें उन लोगों की तुलना में अधिक अनुमानित जोखिम मिले जो नहीं करते हैं, जबकि अंशांकन अनुमानित संभावनाओं और देखी गई आवृत्तियों के बीच समझौता है; एक मॉडल अच्छी तरह से भेदभाव कर सकता है फिर भी खराब अंशांकित हो सकता है, इसलिए दोनों मायने रखते हैं।
- क्लिनिकल प्रेडिक्शन मॉडल के लिए बाहरी सत्यापन क्यों महत्वपूर्ण है?
- मॉडल अक्सर उन्हें बनाने के लिए उपयोग किए गए डेटा पर आशावादी रूप से प्रदर्शन करते हैं; स्वतंत्र आबादी और सेटिंग्स पर परीक्षण से पता चलता है कि एक मॉडल कितनी अच्छी तरह सामान्य होता है और उन उपकरणों को तैनात करने से बचाता है जो विफल हो जाते हैं जब केस मिक्स या प्रलेखन विकास डेटा से भिन्न होता है।