भेदभाव और अंशांकन में क्या अंतर है?

भेदभाव एक मॉडल की रोगियों को रैंक करने की क्षमता है ताकि जो लोग परिणाम का अनुभव करते हैं उन्हें उन लोगों की तुलना में अधिक अनुमानित जोखिम मिले जो नहीं करते हैं, जबकि अंशांकन अनुमानित संभावनाओं और देखी गई आवृत्तियों के बीच समझौता है; एक मॉडल अच्छी तरह से भेदभाव कर सकता है फिर भी खराब अंशांकित हो सकता है, इसलिए दोनों मायने रखते हैं।

क्लिनिकल प्रेडिक्शन मॉडल के लिए बाहरी सत्यापन क्यों महत्वपूर्ण है?

मॉडल अक्सर उन्हें बनाने के लिए उपयोग किए गए डेटा पर आशावादी रूप से प्रदर्शन करते हैं; स्वतंत्र आबादी और सेटिंग्स पर परीक्षण से पता चलता है कि एक मॉडल कितनी अच्छी तरह सामान्य होता है और उन उपकरणों को तैनात करने से बचाता है जो विफल हो जाते हैं जब केस मिक्स या प्रलेखन विकास डेटा से भिन्न होता है।

क्लिनिकल देखभाल में मशीन लर्निंग और प्रेडिक्टिव एनालिटिक्स

मशीन लर्निंग और प्रेडिक्टिव एनालिटिक्स व्यक्तिगत रोगियों के लिए निदान, बिगड़ना, पुन: प्रवेश, या उपचार के प्रति प्रतिक्रिया जैसे परिणामों की संभावना का अनुमान लगाने के लिए क्लिनिकल और स्वास्थ्य डेटा में पैटर्न का उपयोग करते हैं। यह विषय बताता है कि क्लिनिकल प्रेडिक्शन मॉडल कैसे विकसित, मान्य और रिपोर्ट किए जाते हैं, और कार्यप्रणाली संबंधी मानक जो विश्वसनीय मॉडल को भ्रामक मॉडल से अलग करते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

क्लिनिकल मशीन लर्निंग उन एल्गोरिदम का उपयोग है जो चिकित्सकीय रूप से प्रासंगिक परिणामों की भविष्यवाणी करने के लिए रोगी डेटा से सांख्यिकीय संबंध सीखते हैं; एक क्लिनिकल प्रेडिक्शन मॉडल एक व्यक्ति के लिए निदान (नैदानिक) या भविष्य की घटना (पूर्वानुमानित) की संभावना का अनुमान लगाने के लिए कई भविष्यवाणियों को जोड़ता है।

Scope

यह प्रविष्टि निदान और पूर्वानुमान के लिए पर्यवेक्षित शिक्षण (supervised learning), क्लिनिकल सेटिंग्स में उपयोग किए जाने वाले डेटा स्रोतों और विशेषताओं, भेदभाव (discrimination), अंशांकन (calibration) और बाहरी सत्यापन (external validation) की केंद्रीय सत्यापन अवधारणाओं, पूर्वाग्रह और अति-अनुकूलन (overfitting) के जोखिमों, और TRIPOD और PROBAST जैसे रिपोर्टिंग और मूल्यांकन मानकों को शामिल करती है। यह क्लिनिकल मशीन लर्निंग को एक कार्यप्रणाली संबंधी विषय के रूप में प्रस्तुत करता है, जिसमें यह बताया गया है कि भविष्य कहनेवाला उपकरण कैसे बनाए और परखे जाते हैं, न कि क्लिनिकल सिफारिशें प्रदान करते हैं।

Key concepts

पर्यवेक्षित शिक्षण (निदान और पूर्वानुमान)
भेदभाव, अंशांकन और क्लिनिकल उपयोगिता
आंतरिक और बाहरी सत्यापन
अति-अनुकूलन और आशावाद
डेटासेट शिफ्ट और सामान्यीकरण
एल्गोरिथम पूर्वाग्रह और निष्पक्षता
रिपोर्टिंग मानक (TRIPOD) और पूर्वाग्रह के जोखिम का मूल्यांकन (PROBAST)
डीप लर्निंग और फीचर लर्निंग

Mechanisms

एक क्लिनिकल प्रेडिक्शन मॉडल को लेबल किए गए डेटा पर फिट किया जाता है, यह सीखता है कि भविष्यवाणियां किसी परिणाम से कैसे संबंधित हैं, और फिर भेदभाव (यह कितनी अच्छी तरह उन लोगों को अलग करता है जो परिणाम का अनुभव करते हैं और नहीं करते हैं) और अंशांकन (भविष्यवाणी की गई संभावनाएं देखी गई आवृत्तियों से कितनी अच्छी तरह मेल खाती हैं) के लिए मूल्यांकन किया जाता है। क्योंकि मॉडल उन डेटा पर आशावादी रूप से प्रदर्शन करते हैं जिन्होंने उन्हें प्रशिक्षित किया है, नए आबादी पर आंतरिक और विशेष रूप से बाहरी सत्यापन आवश्यक हैं, और जब लक्ष्य सेटिंग विकास सेटिंग से भिन्न होती है तो डेटासेट शिफ्ट (dataset shift) द्वारा परिनियोजन को कमजोर किया जा सकता है (राजकुमार, 2019)। डीप लर्निंग छवियों, संकेतों या पाठ जैसे कच्चे इनपुट से सीधे सुविधाओं को सीखकर इन विचारों का विस्तार करता है, जो व्याख्यात्मकता को जटिल करते हुए अवधारणात्मक कार्यों पर प्रदर्शन में सुधार कर सकता है (एस्टेवा, 2019)।

Clinical relevance

प्रेडिक्टिव मॉडल तेजी से क्लिनिकल प्रणालियों में एम्बेडेड जोखिम स्कोर, प्रारंभिक चेतावनी अलर्ट और ट्राइएज टूल को फीड करते हैं, इसलिए उनकी सटीकता, अंशांकन और निष्पक्षता सीधे उन मार्गदर्शन की गुणवत्ता को प्रभावित करती है जो चिकित्सकों को प्राप्त होता है। यह प्रविष्टि बताती है कि ऐसे मॉडल कैसे विकसित और मूल्यांकन किए जाते हैं; मॉडल आउटपुट संभाव्य अनुमान हैं जिनके लिए क्लिनिकल व्याख्या और निरीक्षण की आवश्यकता होती है, और यह पाठ किसी भी व्यक्तिगत नैदानिक या उपचार निर्णय का आधार नहीं है।

Evidence & guidelines

कार्यप्रणाली संबंधी सहमति पारदर्शी विकास और कठोर सत्यापन पर जोर देती है। TRIPOD स्टेटमेंट प्रेडिक्शन-मॉडल अध्ययनों के लिए रिपोर्टिंग मानक निर्धारित करता है ताकि तरीकों और प्रदर्शन का मूल्यांकन किया जा सके (कॉलिन, 2015), और PROBAST ऐसे अध्ययनों में पूर्वाग्रह के जोखिम और प्रयोज्यता का न्याय करने के लिए एक संरचित उपकरण प्रदान करता है (वोल्फ, 2019)। चिकित्सा में मशीन लर्निंग की समीक्षा बाहरी सत्यापन, अंशांकन, पूर्वाग्रह पर ध्यान और पूर्वव्यापी प्रदर्शन और संभावित क्लिनिकल लाभ के बीच के अंतर पर जोर देती है (राजकुमार, 2019; एस्टेवा, 2019)।

History

क्लिनिकल प्रेडिक्शन की जड़ें लंबे समय से प्रतिगमन-आधारित जोखिम स्कोर में हैं, लेकिन 2010 के दशक में इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड, इमेजिंग और बड़े डेटासेट द्वारा पोषित मशीन लर्निंग और डीप लर्निंग में तेजी से वृद्धि देखी गई। इसके साथ ही प्रजनन क्षमता, अतिरंजित प्रदर्शन और पूर्वाग्रह के बारे में बढ़ती चिंता भी आई, जिससे रिपोर्टिंग और मूल्यांकन ढांचे (TRIPOD, PROBAST) को बढ़ावा मिला, जिसका उद्देश्य मॉडल अध्ययनों को सुसंगत कार्यप्रणाली मानकों पर रखना था।

Debates

विकास अध्ययनों की तुलना में व्यवहार में कई मॉडल खराब प्रदर्शन क्यों करते हैं?: अपर्याप्त बाहरी सत्यापन, विकास और परिनियोजन सेटिंग्स के बीच डेटासेट शिफ्ट, और आशावादी रिपोर्टिंग का मतलब है कि मजबूत पूर्वव्यापी प्रदर्शन अक्सर संभावित क्लिनिकल लाभ में परिवर्तित होने में विफल रहता है, जिससे सख्त सत्यापन और रिपोर्टिंग मानकों को प्रेरित किया जाता है।
एल्गोरिथम पूर्वाग्रह और निष्पक्षता को कैसे संभाला जाना चाहिए?: ऐतिहासिक डेटा पर प्रशिक्षित मॉडल असमानताओं को एन्कोड और बढ़ा सकते हैं, जिससे इस बात पर बहस छिड़ जाती है कि निष्पक्षता को कैसे मापा जाए, समूहों में प्रदर्शन अंतर कब स्वीकार्य हैं, और समय के साथ पूर्वाग्रह के लिए तैनात मॉडल की निगरानी कैसे की जाए।

Key figures

Alvin Rajkomar
Gary S. Collins
Karel G. M. Moons
Isaac Kohane

Seminal works

rajkomar-2019
collins-2015
wolff-2019

Frequently asked questions

भेदभाव और अंशांकन में क्या अंतर है?: भेदभाव एक मॉडल की रोगियों को रैंक करने की क्षमता है ताकि जो लोग परिणाम का अनुभव करते हैं उन्हें उन लोगों की तुलना में अधिक अनुमानित जोखिम मिले जो नहीं करते हैं, जबकि अंशांकन अनुमानित संभावनाओं और देखी गई आवृत्तियों के बीच समझौता है; एक मॉडल अच्छी तरह से भेदभाव कर सकता है फिर भी खराब अंशांकित हो सकता है, इसलिए दोनों मायने रखते हैं।
क्लिनिकल प्रेडिक्शन मॉडल के लिए बाहरी सत्यापन क्यों महत्वपूर्ण है?: मॉडल अक्सर उन्हें बनाने के लिए उपयोग किए गए डेटा पर आशावादी रूप से प्रदर्शन करते हैं; स्वतंत्र आबादी और सेटिंग्स पर परीक्षण से पता चलता है कि एक मॉडल कितनी अच्छी तरह सामान्य होता है और उन उपकरणों को तैनात करने से बचाता है जो विफल हो जाते हैं जब केस मिक्स या प्रलेखन विकास डेटा से भिन्न होता है।