डेटा लुप्त होने का कारण कितना लुप्त है, इससे अधिक महत्वपूर्ण क्यों है?

यदि लुप्त होने की संभावना अनदेखे मान पर निर्भर करती है, तो थोड़ी मात्रा में लुप्त डेटा भी परिणामों को पक्षपातपूर्ण कर सकता है, जबकि मान से असंबंधित कारणों से लुप्त डेटा मुख्य रूप से परिशुद्धता की कीमत पर आता है; तंत्र, न केवल मात्रा, यह निर्धारित करता है कि कितना और किस प्रकार का पूर्वाग्रह उत्पन्न होता है।

इंटेंशन-टू-ट्रीट विश्लेषण क्या है और यह क्षरण के लिए क्यों मायने रखता है?

इंटेंशन-टू-ट्रीट प्रतिभागियों का विश्लेषण उन समूहों में करता है जिनमें उन्हें यादृच्छिक किया गया था, चाहे बाद में कुछ भी हुआ हो, जो यादृच्छिकीकरण द्वारा बनाए गए संतुलन को बनाए रखता है; यह क्षरण के लिए मायने रखता है क्योंकि ड्रॉपआउट को बाहर करना या केवल उन लोगों का विश्लेषण करना जिन्होंने उपचार पूरा किया, उस भ्रम को फिर से पेश कर सकता है जिसे यादृच्छिकीकरण ने हटा दिया था।

लुप्त डेटा और क्षरण

लुप्त डेटा वे मान होते हैं जिन्हें एकत्र करने का इरादा था लेकिन प्राप्त नहीं किया गया, और क्षरण अध्ययन के दौरान प्रतिभागियों का नुकसान है, जो अक्सर बीच में छोड़ देने या अनुवर्ती कार्रवाई में कमी के कारण होता है। दोनों उपलब्ध जानकारी को कम करते हैं और, अधिक गंभीरता से, परिणामों को पक्षपातपूर्ण कर सकते हैं जब किसी मान के लुप्त होने की संभावना उस मान से संबंधित होती है जो वह होता। डिज़ाइन चरण में लुप्तता का अनुमान लगाना और उसे सीमित करना, और विश्लेषण में इसे उचित रूप से संभालना, अध्ययन की वैधता को बनाए रखने के लिए आवश्यक है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

लुप्त डेटा वे इच्छित अवलोकन हैं जिन्हें रिकॉर्ड नहीं किया गया था, और क्षरण एक अध्ययन के दौरान नामांकित प्रतिभागियों का नुकसान है; उनका प्रभाव लुप्तता तंत्र पर निर्भर करता है, जो पूरी तरह से यादृच्छिक रूप से लुप्त (किसी भी डेटा से असंबंधित) से लेकर यादृच्छिक रूप से लुप्त (अवलोकित डेटा द्वारा व्याख्या योग्य) तक और यादृच्छिक रूप से नहीं लुप्त (स्वयं अनदेखे मान से संबंधित) तक होता है।

Scope

यह प्रविष्टि लुप्तता के प्रकारों (पूरी तरह से यादृच्छिक रूप से लुप्त, यादृच्छिक रूप से लुप्त, और यादृच्छिक रूप से नहीं लुप्त), पूर्वाग्रह और शक्ति के लिए क्षरण के परिणाम, डिज़ाइन और आचरण में निर्मित रोकथाम रणनीतियों, और बहु-आरोपण (multiple imputation) और इंटेंशन-टू-ट्रीट दृष्टिकोण (intention-to-treat approach) जैसे सैद्धांतिक हैंडलिंग विधियों को शामिल करती है। इसे एक पद्धतिगत संदर्भ के रूप में तैयार किया गया है और यह नैदानिक निर्देश नहीं देता है।

Key concepts

पूरी तरह से यादृच्छिक रूप से लुप्त (MCAR)
यादृच्छिक रूप से लुप्त (MAR)
यादृच्छिक रूप से नहीं लुप्त (MNAR)
अनुवर्ती कार्रवाई में कमी और ड्रॉपआउट
बहु-आरोपण (Multiple imputation)
इंटेंशन-टू-ट्रीट विश्लेषण (Intention-to-treat analysis)
पूर्ण-मामला विश्लेषण (Complete-case analysis) और इसके पूर्वाग्रह
लुप्तता धारणाओं के लिए संवेदनशीलता विश्लेषण (Sensitivity analysis)

Mechanisms

लुप्त डेटा से खतरा इस बात पर निर्भर करता है कि मान क्यों लुप्त हैं। यदि लुप्तता किसी भी डेटा (MCAR) से असंबंधित है, तो सरल विश्लेषण परिशुद्धता खो देते हैं लेकिन निष्पक्ष रहते हैं; यदि इसे अवलोकित चर (MAR) द्वारा पूरी तरह से समझाया जा सकता है, तो बहु-आरोपण जैसी विधियाँ अवलोकित मानों से लुप्त मानों को मॉडल करके वैध अनुमानों को पुनः प्राप्त कर सकती हैं; यदि यह स्वयं अनदेखे मान (MNAR) पर निर्भर करता है, तो कोई भी विधि निष्पक्ष परिणाम की गारंटी नहीं दे सकती है और निष्कर्ष अप्रमाणित धारणाओं पर निर्भर करते हैं। उपचार या पूर्वानुमान से संबंधित क्षरण यादृच्छिकीकरण द्वारा बनाए गए संतुलन को तोड़ सकता है, यही कारण है कि इंटेंशन-टू-ट्रीट विश्लेषण प्रतिभागियों को उनके निर्दिष्ट समूहों में रखता है और यही कारण है कि बाद की मरम्मत के बजाय रोकथाम पर जोर दिया जाता है। संवेदनशीलता विश्लेषण (Sensitivity analyses) यह जांच करते हैं कि लुप्तता के बारे में विभिन्न धारणाओं के तहत निष्कर्ष कैसे बदलते हैं।

Clinical relevance

यह आकलन करना कि कितना डेटा लुप्त था, क्यों, और इसे कैसे संभाला गया, यह तय करने का एक हिस्सा है कि किसी अध्ययन के परिणाम विश्वसनीय हैं या नहीं, क्योंकि उच्च या विभेदक क्षरण एक प्रभाव को बढ़ा या छिपा सकता है। यह प्रविष्टि मूल्यांकन के लिए अनुसंधान पद्धति का वर्णन करती है और नैदानिक या उपचार मार्गदर्शन का स्रोत नहीं है।

Evidence & guidelines

यू.एस. खाद्य एवं औषधि प्रशासन (U.S. Food and Drug Administration) के लिए गठित एक विशेषज्ञ पैनल ने परीक्षण डिजाइन और आचरण के माध्यम से लुप्त डेटा को रोकने पर जोर दिया और किसी एक विश्लेषणात्मक समाधान पर निर्भर रहने के खिलाफ चेतावनी दी। पद्धतिगत मार्गदर्शन यादृच्छिक रूप से लुप्त होने की धारणा के तहत बहु-आरोपण और इसकी कमियों, और लुप्त परिणामों वाले परीक्षणों के लिए इंटेंशन-टू-ट्रीट ढांचे का वर्णन करता है; CONSORT जैसे रिपोर्टिंग मानक नुकसानों का दस्तावेजीकरण करने वाले प्रतिभागी प्रवाह आरेख की आवश्यकता होती है। सर्वेक्षणों से पता चलता है कि इंटेंशन-टू-ट्रीट को अक्सर व्यवहार में असंगत रूप से परिभाषित और लागू किया जाता है।

History

आधुनिक ढांचा रुबिन के 1970 के दशक के लुप्तता तंत्र के औपचारिककरण और लिटिल और रुबिन के लुप्त डेटा के साथ सांख्यिकीय विश्लेषण पर बाद के काम से आकार लिया गया था, जिसने बहु-आरोपण की शुरुआत की। जैसे-जैसे यादृच्छिक परीक्षण परिपक्व हुए, इंटेंशन-टू-ट्रीट सिद्धांत यादृच्छिकीकरण को तोड़े बिना ड्रॉपआउट को संभालने के लिए केंद्रीय हो गया। 2010 की यू.एस. राष्ट्रीय अनुसंधान परिषद (U.S. National Research Council) की रिपोर्ट और संबंधित एफडीए-नियुक्त पैनल ने बाद में लुप्त डेटा को मुख्य रूप से डिजाइन द्वारा रोकथाम की समस्या के रूप में फिर से परिभाषित किया, न कि पोस्ट हॉक सांख्यिकीय सुधार की समस्या के रूप में।

Debates

क्या बहु-आरोपण पर्याप्त लुप्त डेटा वाले अध्ययन को बचा सकता है?: जब डेटा यादृच्छिक रूप से लुप्त होता है तो बहु-आरोपण वैध अनुमान देता है, लेकिन इसकी वैधता एक ऐसी धारणा पर टिकी होती है जिसे डेटा से सत्यापित नहीं किया जा सकता है; जब डेटा यादृच्छिक रूप से लुप्त नहीं होता है तो यह गुमराह कर सकता है, इसलिए यह एक उपकरण है जिसका उपयोग संवेदनशीलता विश्लेषण के साथ किया जाना चाहिए न कि एक गारंटीकृत समाधान के रूप में।
इंटेंशन-टू-ट्रीट को लुप्त परिणामों को कैसे संभालना चाहिए?: इंटेंशन-टू-ट्रीट प्रतिभागियों को उनके यादृच्छिक समूहों में रखता है ताकि संतुलन बना रहे, लेकिन जब परिणाम लुप्त होते हैं तो इसे लुप्त मानों के बारे में धारणाओं के बिना लागू नहीं किया जा सकता है; सिद्धांत को आरोपण और संवेदनशीलता विश्लेषण के साथ कैसे जोड़ा जाए यह एक व्यावहारिक चुनौती बनी हुई है।

Key figures

Roderick Little
Donald Rubin
Ian White
Jonathan Sterne
Douglas Altman

Seminal works

little-2012-prevention
sterne-2009-mi
white-2011-itt

Frequently asked questions

डेटा लुप्त होने का कारण कितना लुप्त है, इससे अधिक महत्वपूर्ण क्यों है?: यदि लुप्त होने की संभावना अनदेखे मान पर निर्भर करती है, तो थोड़ी मात्रा में लुप्त डेटा भी परिणामों को पक्षपातपूर्ण कर सकता है, जबकि मान से असंबंधित कारणों से लुप्त डेटा मुख्य रूप से परिशुद्धता की कीमत पर आता है; तंत्र, न केवल मात्रा, यह निर्धारित करता है कि कितना और किस प्रकार का पूर्वाग्रह उत्पन्न होता है।
इंटेंशन-टू-ट्रीट विश्लेषण क्या है और यह क्षरण के लिए क्यों मायने रखता है?: इंटेंशन-टू-ट्रीट प्रतिभागियों का विश्लेषण उन समूहों में करता है जिनमें उन्हें यादृच्छिक किया गया था, चाहे बाद में कुछ भी हुआ हो, जो यादृच्छिकीकरण द्वारा बनाए गए संतुलन को बनाए रखता है; यह क्षरण के लिए मायने रखता है क्योंकि ड्रॉपआउट को बाहर करना या केवल उन लोगों का विश्लेषण करना जिन्होंने उपचार पूरा किया, उस भ्रम को फिर से पेश कर सकता है जिसे यादृच्छिकीकरण ने हटा दिया था।