लुप्त डेटा और क्षरण
लुप्त डेटा वे मान होते हैं जिन्हें एकत्र करने का इरादा था लेकिन प्राप्त नहीं किया गया, और क्षरण अध्ययन के दौरान प्रतिभागियों का नुकसान है, जो अक्सर बीच में छोड़ देने या अनुवर्ती कार्रवाई में कमी के कारण होता है। दोनों उपलब्ध जानकारी को कम करते हैं और, अधिक गंभीरता से, परिणामों को पक्षपातपूर्ण कर सकते हैं जब किसी मान के लुप्त होने की संभावना उस मान से संबंधित होती है जो वह होता। डिज़ाइन चरण में लुप्तता का अनुमान लगाना और उसे सीमित करना, और विश्लेषण में इसे उचित रूप से संभालना, अध्ययन की वैधता को बनाए रखने के लिए आवश्यक है।
Definition
लुप्त डेटा वे इच्छित अवलोकन हैं जिन्हें रिकॉर्ड नहीं किया गया था, और क्षरण एक अध्ययन के दौरान नामांकित प्रतिभागियों का नुकसान है; उनका प्रभाव लुप्तता तंत्र पर निर्भर करता है, जो पूरी तरह से यादृच्छिक रूप से लुप्त (किसी भी डेटा से असंबंधित) से लेकर यादृच्छिक रूप से लुप्त (अवलोकित डेटा द्वारा व्याख्या योग्य) तक और यादृच्छिक रूप से नहीं लुप्त (स्वयं अनदेखे मान से संबंधित) तक होता है।
Scope
यह प्रविष्टि लुप्तता के प्रकारों (पूरी तरह से यादृच्छिक रूप से लुप्त, यादृच्छिक रूप से लुप्त, और यादृच्छिक रूप से नहीं लुप्त), पूर्वाग्रह और शक्ति के लिए क्षरण के परिणाम, डिज़ाइन और आचरण में निर्मित रोकथाम रणनीतियों, और बहु-आरोपण (multiple imputation) और इंटेंशन-टू-ट्रीट दृष्टिकोण (intention-to-treat approach) जैसे सैद्धांतिक हैंडलिंग विधियों को शामिल करती है। इसे एक पद्धतिगत संदर्भ के रूप में तैयार किया गया है और यह नैदानिक निर्देश नहीं देता है।
Key concepts
- पूरी तरह से यादृच्छिक रूप से लुप्त (MCAR)
- यादृच्छिक रूप से लुप्त (MAR)
- यादृच्छिक रूप से नहीं लुप्त (MNAR)
- अनुवर्ती कार्रवाई में कमी और ड्रॉपआउट
- बहु-आरोपण (Multiple imputation)
- इंटेंशन-टू-ट्रीट विश्लेषण (Intention-to-treat analysis)
- पूर्ण-मामला विश्लेषण (Complete-case analysis) और इसके पूर्वाग्रह
- लुप्तता धारणाओं के लिए संवेदनशीलता विश्लेषण (Sensitivity analysis)
Mechanisms
लुप्त डेटा से खतरा इस बात पर निर्भर करता है कि मान क्यों लुप्त हैं। यदि लुप्तता किसी भी डेटा (MCAR) से असंबंधित है, तो सरल विश्लेषण परिशुद्धता खो देते हैं लेकिन निष्पक्ष रहते हैं; यदि इसे अवलोकित चर (MAR) द्वारा पूरी तरह से समझाया जा सकता है, तो बहु-आरोपण जैसी विधियाँ अवलोकित मानों से लुप्त मानों को मॉडल करके वैध अनुमानों को पुनः प्राप्त कर सकती हैं; यदि यह स्वयं अनदेखे मान (MNAR) पर निर्भर करता है, तो कोई भी विधि निष्पक्ष परिणाम की गारंटी नहीं दे सकती है और निष्कर्ष अप्रमाणित धारणाओं पर निर्भर करते हैं। उपचार या पूर्वानुमान से संबंधित क्षरण यादृच्छिकीकरण द्वारा बनाए गए संतुलन को तोड़ सकता है, यही कारण है कि इंटेंशन-टू-ट्रीट विश्लेषण प्रतिभागियों को उनके निर्दिष्ट समूहों में रखता है और यही कारण है कि बाद की मरम्मत के बजाय रोकथाम पर जोर दिया जाता है। संवेदनशीलता विश्लेषण (Sensitivity analyses) यह जांच करते हैं कि लुप्तता के बारे में विभिन्न धारणाओं के तहत निष्कर्ष कैसे बदलते हैं।
Clinical relevance
यह आकलन करना कि कितना डेटा लुप्त था, क्यों, और इसे कैसे संभाला गया, यह तय करने का एक हिस्सा है कि किसी अध्ययन के परिणाम विश्वसनीय हैं या नहीं, क्योंकि उच्च या विभेदक क्षरण एक प्रभाव को बढ़ा या छिपा सकता है। यह प्रविष्टि मूल्यांकन के लिए अनुसंधान पद्धति का वर्णन करती है और नैदानिक या उपचार मार्गदर्शन का स्रोत नहीं है।
Evidence & guidelines
यू.एस. खाद्य एवं औषधि प्रशासन (U.S. Food and Drug Administration) के लिए गठित एक विशेषज्ञ पैनल ने परीक्षण डिजाइन और आचरण के माध्यम से लुप्त डेटा को रोकने पर जोर दिया और किसी एक विश्लेषणात्मक समाधान पर निर्भर रहने के खिलाफ चेतावनी दी। पद्धतिगत मार्गदर्शन यादृच्छिक रूप से लुप्त होने की धारणा के तहत बहु-आरोपण और इसकी कमियों, और लुप्त परिणामों वाले परीक्षणों के लिए इंटेंशन-टू-ट्रीट ढांचे का वर्णन करता है; CONSORT जैसे रिपोर्टिंग मानक नुकसानों का दस्तावेजीकरण करने वाले प्रतिभागी प्रवाह आरेख की आवश्यकता होती है। सर्वेक्षणों से पता चलता है कि इंटेंशन-टू-ट्रीट को अक्सर व्यवहार में असंगत रूप से परिभाषित और लागू किया जाता है।
History
आधुनिक ढांचा रुबिन के 1970 के दशक के लुप्तता तंत्र के औपचारिककरण और लिटिल और रुबिन के लुप्त डेटा के साथ सांख्यिकीय विश्लेषण पर बाद के काम से आकार लिया गया था, जिसने बहु-आरोपण की शुरुआत की। जैसे-जैसे यादृच्छिक परीक्षण परिपक्व हुए, इंटेंशन-टू-ट्रीट सिद्धांत यादृच्छिकीकरण को तोड़े बिना ड्रॉपआउट को संभालने के लिए केंद्रीय हो गया। 2010 की यू.एस. राष्ट्रीय अनुसंधान परिषद (U.S. National Research Council) की रिपोर्ट और संबंधित एफडीए-नियुक्त पैनल ने बाद में लुप्त डेटा को मुख्य रूप से डिजाइन द्वारा रोकथाम की समस्या के रूप में फिर से परिभाषित किया, न कि पोस्ट हॉक सांख्यिकीय सुधार की समस्या के रूप में।
Debates
- क्या बहु-आरोपण पर्याप्त लुप्त डेटा वाले अध्ययन को बचा सकता है?
- जब डेटा यादृच्छिक रूप से लुप्त होता है तो बहु-आरोपण वैध अनुमान देता है, लेकिन इसकी वैधता एक ऐसी धारणा पर टिकी होती है जिसे डेटा से सत्यापित नहीं किया जा सकता है; जब डेटा यादृच्छिक रूप से लुप्त नहीं होता है तो यह गुमराह कर सकता है, इसलिए यह एक उपकरण है जिसका उपयोग संवेदनशीलता विश्लेषण के साथ किया जाना चाहिए न कि एक गारंटीकृत समाधान के रूप में।
- इंटेंशन-टू-ट्रीट को लुप्त परिणामों को कैसे संभालना चाहिए?
- इंटेंशन-टू-ट्रीट प्रतिभागियों को उनके यादृच्छिक समूहों में रखता है ताकि संतुलन बना रहे, लेकिन जब परिणाम लुप्त होते हैं तो इसे लुप्त मानों के बारे में धारणाओं के बिना लागू नहीं किया जा सकता है; सिद्धांत को आरोपण और संवेदनशीलता विश्लेषण के साथ कैसे जोड़ा जाए यह एक व्यावहारिक चुनौती बनी हुई है।
Key figures
- Roderick Little
- Donald Rubin
- Ian White
- Jonathan Sterne
- Douglas Altman
Related topics
Seminal works
- little-2012-prevention
- sterne-2009-mi
- white-2011-itt
Frequently asked questions
- डेटा लुप्त होने का कारण कितना लुप्त है, इससे अधिक महत्वपूर्ण क्यों है?
- यदि लुप्त होने की संभावना अनदेखे मान पर निर्भर करती है, तो थोड़ी मात्रा में लुप्त डेटा भी परिणामों को पक्षपातपूर्ण कर सकता है, जबकि मान से असंबंधित कारणों से लुप्त डेटा मुख्य रूप से परिशुद्धता की कीमत पर आता है; तंत्र, न केवल मात्रा, यह निर्धारित करता है कि कितना और किस प्रकार का पूर्वाग्रह उत्पन्न होता है।
- इंटेंशन-टू-ट्रीट विश्लेषण क्या है और यह क्षरण के लिए क्यों मायने रखता है?
- इंटेंशन-टू-ट्रीट प्रतिभागियों का विश्लेषण उन समूहों में करता है जिनमें उन्हें यादृच्छिक किया गया था, चाहे बाद में कुछ भी हुआ हो, जो यादृच्छिकीकरण द्वारा बनाए गए संतुलन को बनाए रखता है; यह क्षरण के लिए मायने रखता है क्योंकि ड्रॉपआउट को बाहर करना या केवल उन लोगों का विश्लेषण करना जिन्होंने उपचार पूरा किया, उस भ्रम को फिर से पेश कर सकता है जिसे यादृच्छिकीकरण ने हटा दिया था।