नैदानिक दस्तावेज़ीकरण में प्राकृतिक भाषा प्रसंस्करण
नैदानिक जानकारी का एक बड़ा हिस्सा संरचित कोड के बजाय मुक्त पाठ, कथात्मक नोट्स, डिस्चार्ज सारांश, रेडियोलॉजी और पैथोलॉजी रिपोर्ट के रूप में दर्ज किया जाता है। नैदानिक दस्तावेज़ीकरण में प्राकृतिक भाषा प्रसंस्करण (एनएलपी) कम्प्यूटेशनल विधियों का एक समूह है जो उस पाठ से संरचित, मशीन-उपयोगी जानकारी निकालता है, जो कोडिंग और कोहोर्ट पहचान से लेकर निर्णय-समर्थन और भविष्यवाणी प्रणालियों को फीड करने तक के कार्यों का समर्थन करता है।
Definition
नैदानिक प्राकृतिक भाषा प्रसंस्करण कम्प्यूटेशनल भाषाई विधियों का नैदानिक मुक्त पाठ पर अनुप्रयोग है ताकि उसमें निहित जानकारी को पहचाना जा सके, सामान्यीकृत किया जा सके और संरचित किया जा सके, उदाहरण के लिए स्थितियों, निष्कर्षों और दवाओं के उल्लेखों को कोडित अवधारणाओं में मैप करना, जबकि निषेध और अनिश्चितता जैसे संदर्भों का भी ध्यान रखा जाता है।
Scope
यह प्रविष्टि नैदानिक कथाओं पर लागू मुख्य एनएलपी कार्यों को शामिल करती है, जैसे कि टोकनाइजेशन, नामित-इकाई पहचान, नियंत्रित शब्दावली के लिए अवधारणा सामान्यीकरण, निषेध और अभिकथन का पता लगाना, और संबंध निष्कर्षण; स्थापित नैदानिक एनएलपी पाइपलाइन; नैदानिक भाषा की विशेष कठिनाइयाँ; और नियम-आधारित से सांख्यिकीय और तंत्रिका दृष्टिकोणों की ओर बढ़ना। यह एक कार्यप्रणाली विषय है जो बताता है कि पाठ को कैसे संसाधित किया जाता है, न कि नैदानिक सिफारिशों का स्रोत।
Key concepts
- नामित-इकाई पहचान और अवधारणा सामान्यीकरण
- निषेध और अभिकथन का पता लगाना
- सूचना निष्कर्षण और संबंध निष्कर्षण
- यूएमएलएस (UMLS) / नियंत्रित शब्दावलियों के लिए अवधारणा मानचित्रण
- नैदानिक एनएलपी पाइपलाइन (उदाहरण के लिए, cTAKES)
- नियम-आधारित बनाम सांख्यिकीय बनाम तंत्रिका विधियाँ
- नैदानिक पाठ का डी-पहचान
- अस्पष्टता, संक्षेप और डोमेन शिफ्ट
Mechanisms
नैदानिक एनएलपी में सामान्यतः चरणों की एक श्रृंखला होती है: पाठ को खंडित करना और टोकनाइज करना, नैदानिक रूप से प्रासंगिक उल्लेखों को पहचानना, उन्हें नियंत्रित शब्दावली में अवधारणाओं के लिए सामान्यीकृत करना, और निषेध, अनिश्चितता, या क्या कोई निष्कर्ष रोगी या परिवार के सदस्य को संदर्भित करता है, जैसे संदर्भ का पता लगाना। cTAKES जैसी खुली पाइपलाइनों ने नैदानिक कथाओं के लिए इन घटकों को पैक किया और निकाले गए शब्दों को मानकीकृत अवधारणाओं में मैप किया (सावोवा, 2010)। अवधारणा सामान्यीकरण यूएमएलएस (UMLS) जैसे संसाधनों को एकीकृत करने पर निर्भर करता है, जो कई स्रोत शब्दावलियों को जोड़ता है ताकि विभिन्न सतही रूप सामान्य पहचानकर्ताओं में परिवर्तित हो सकें (बोडेनरेडर, 2004)। यह क्षेत्र हाथ से बने नियमों से सांख्यिकीय और तंत्रिका मॉडल की ओर बढ़ गया है, जबकि अंतर्निहित कार्य सुसंगत बने हुए हैं (नाडकर्णी, 2011)।
Clinical relevance
चूंकि इतनी सारी नैदानिक रूप से सार्थक जानकारी कथात्मक नोट्स में रहती है, एनएलपी यह निर्धारित करता है कि उस जानकारी का कितना हिस्सा कोडिंग, गुणवत्ता माप, कोहोर्ट चयन और डाउनस्ट्रीम निर्णय समर्थन के लिए उपलब्ध हो जाता है। यह प्रविष्टि बताती है कि नैदानिक पाठ को कैसे संसाधित और संरचित किया जाता है; निकाली गई जानकारी के लिए सत्यापन और मानवीय पर्यवेक्षण की आवश्यकता होती है, और पाठ किसी भी व्यक्तिगत नैदानिक या उपचार निर्णय का आधार नहीं है।
Evidence & guidelines
नैदानिक एनएलपी का मूल्यांकन मुख्य रूप से कार्य-विशिष्ट प्रदर्शन मेट्रिक्स और साझा मूल्यांकन चुनौतियों के माध्यम से किया जाता है, न कि नैदानिक-परिणाम परीक्षणों के माध्यम से। परिचयात्मक और सिस्टम पेपर मानक पाइपलाइन और उसके घटकों का दस्तावेजीकरण करते हैं (नाडकर्णी, 2011; सावोवा, 2010), और अवधारणा सामान्यीकरण यूएमएलएस (UMLS) जैसी शब्दावलियों को एकीकृत करने पर निर्भर करता है (बोडेनरेडर, 2004)। प्रदर्शन संस्थानों और नोट प्रकारों में भिन्न होता है, इसलिए स्थानीय सत्यापन पर जोर दिया जाता है।
History
नैदानिक एनएलपी शुरुआती चिकित्सा भाषा प्रसंस्करण प्रणालियों और नियम-आधारित पैटर्न मिलान से विकसित हुआ, जो 2000 के दशक में पुन: प्रयोज्य ओपन-सोर्स पाइपलाइनों और साझा मूल्यांकन चुनौतियों के साथ परिपक्व हुआ जिसने कार्यों और बेंचमार्क को मानकीकृत किया। 2010 के दशक के दौरान यह क्षेत्र नियम-आधारित और शास्त्रीय मशीन-लर्निंग विधियों से तंत्रिका और, बाद में, ट्रांसफार्मर-आधारित भाषा मॉडल की ओर स्थानांतरित हो गया, जबकि वही मुख्य निष्कर्षण और सामान्यीकरण कार्य बरकरार रहे।
Debates
- नैदानिक एनएलपी प्रणालियाँ विभिन्न साइटों पर कितनी पोर्टेबल हैं?
- एक संस्थान के नोट्स पर ट्यून किए गए मॉडल और नियम अक्सर दूसरे संस्थान के नोट्स पर खराब प्रदर्शन करते हैं क्योंकि टेम्पलेट्स, संक्षिप्ताक्षरों और दस्तावेज़ीकरण शैली में अंतर होता है, जिससे सामान्यीकरण, स्थानीय अनुकूलन की आवश्यकता और साझा एनोटेटेड कॉर्पोरा पर बहस छिड़ जाती है।
Key figures
- Wendy W. Chapman
- Guergana K. Savova
- Prakash M. Nadkarni
- Lucila Ohno-Machado
Related topics
Seminal works
- nadkarni-2011
- savova-2010
- bodenreider-2004
Frequently asked questions
- नैदानिक पाठ को संसाधित करना सामान्य पाठ की तुलना में कठिन क्यों है?
- नैदानिक नोट्स संक्षिप्ताक्षरों, गलत वर्तनी, टेम्पलेटेड टुकड़ों और डोमेन-विशिष्ट शब्दों से भरे होते हैं, और अर्थ अक्सर निषेध या अनिश्चितता जैसे संदर्भ पर निर्भर करता है, ये सभी सामान्य गद्य की तुलना में सटीक निष्कर्षण को अधिक कठिन बनाते हैं।
- नैदानिक एनएलपी में अवधारणा सामान्यीकरण क्या है?
- यह एक पाठ्य उल्लेख, जैसे 'हार्ट अटैक' या 'एमआई', को एक नियंत्रित शब्दावली में एक एकल मानकीकृत अवधारणा में मैप करने का चरण है, ताकि एक ही विचार के विभिन्न सतही रूपों को डाउनस्ट्रीम सिस्टम द्वारा लगातार व्यवहार किया जा सके।