श्रेणीबद्ध डेटा विश्लेषण
श्रेणीबद्ध डेटा विश्लेषण बायोस्टैटिस्टिक्स की वह शाखा है जो ऐसे डेटा से संबंधित है जो निरंतर संख्यात्मक मान लेने के बजाय असतत श्रेणियों में आते हैं — जैसे किसी बीमारी का मौजूद होना या अनुपस्थित होना, किसी ट्यूमर का सौम्य या घातक होना, किसी मरीज को कई उपचार शाखाओं में से किसी एक में सौंपा जाना। इसका केंद्रीय उद्देश्य गणनाओं की आकस्मिकता तालिका (contingency table) है, और इसकी विधियाँ अन्य चरों को नियंत्रित करते हुए श्रेणीबद्ध चरों के बीच संबंधों का परीक्षण और मात्रा निर्धारण करती हैं।
Definition
श्रेणीबद्ध डेटा विश्लेषण सांख्यिकीय विधियों का एक समूह है जो उन चरों के बीच संबंधों का वर्णन, परीक्षण और मॉडलिंग करने के लिए है जिनके मान अव्यवस्थित या व्यवस्थित असतत श्रेणियों के भीतर गणनाएँ हैं, जिन्हें आमतौर पर आवृत्तियों की आकस्मिकता तालिकाओं के रूप में व्यवस्थित किया जाता है।
Scope
यह क्षेत्र पाठक को उन मुख्य विचारों से परिचित कराता है जो इसके नीचे के विषय पृष्ठों में बार-बार आते हैं: श्रेणीबद्ध अवलोकनों को आकस्मिकता तालिकाओं में कैसे व्यवस्थित किया जाता है, एक तालिका में संबंध का परीक्षण कैसे किया जाता है (काई-वर्ग और सटीक परीक्षण), एक संबंध को प्रभाव माप (जोखिम अनुपात और विषम अनुपात) द्वारा कैसे संक्षेपित किया जाता है, और एक भ्रमित करने वाले श्रेणीबद्ध चर को स्तरीकरण (Mantel-Haenszel methods) द्वारा कैसे नियंत्रित किया जाता है। यह इन्हें स्वास्थ्य अनुसंधान को पढ़ने और उत्पन्न करने के लिए कार्यप्रणाली उपकरणों के रूप में प्रस्तुत करता है, न कि नैदानिक मार्गदर्शन के रूप में।
Sub-topics
Core questions
- क्या दो श्रेणीबद्ध चरों के बीच कोई संबंध है, या वे स्वतंत्र हैं?
- जोखिमों या विषमताओं के अनुपात या अंतर के रूप में व्यक्त संबंध कितना बड़ा है?
- क्या किसी तीसरे श्रेणीबद्ध चर पर स्तरीकरण के बाद एक स्पष्ट संबंध बना रहता है, या यह उसके द्वारा भ्रमित या संशोधित होता है?
- जब कोशिका गणनाएँ छोटी होती हैं, तो कौन सी सटीक प्रक्रिया बड़े-नमूना सन्निकटन का स्थान लेती है?
Key concepts
- गणनाओं की आकस्मिकता तालिका
- श्रेणीबद्ध चरों की स्वतंत्रता
- संबंध का काई-वर्ग परीक्षण
- विरल तालिकाओं के लिए सटीक परीक्षण
- प्रभाव माप: जोखिम अनुपात और विषम अनुपात
- स्तरीकरण और मैन्टेल-हेन्ज़ेल अनुमानक
- स्तरों में भ्रम और प्रभाव संशोधन
- तालिकाओं के लिए लॉग-रैखिक और लॉजिस्टिक मॉडल
Mechanisms
श्रेणीबद्ध अवलोकनों को एक तालिका में क्रॉस-वर्गीकृत किया जाता है जिसकी कोशिकाओं में आवृत्तियाँ होती हैं। संबंध का एक परीक्षण प्रेक्षित कोशिका गणनाओं की तुलना उन गणनाओं से करता है जिनकी अपेक्षा की जाती है यदि पंक्ति और स्तंभ चर स्वतंत्र होते: पियर्सन का काई-वर्ग सांख्यिकी, जिसकी स्वतंत्रता की डिग्री के फिशर के स्पष्टीकरण द्वारा स्पर्शोन्मुख रूप से पुष्टि की जाती है, मानकीकृत अंतरों के वर्गों का योग करता है, जबकि सटीक परीक्षण तालिकाओं के सशर्त वितरण की गणना करते हैं जब गणनाएँ सन्निकटन के लिए बहुत कम होती हैं। संबंध की शक्ति को फिर तालिका से प्राप्त एक प्रभाव माप — एक जोखिम अनुपात या एक विषम अनुपात — द्वारा संक्षेपित किया जाता है। जब एक तीसरा चर संबंध को भ्रमित करने की धमकी देता है, तो डेटा को उस चर द्वारा परिभाषित स्तरों में विभाजित किया जाता है और स्तरों में एक संयुक्त अनुमान बनाया जाता है; मैन्टेल-हेन्ज़ेल प्रक्रिया ऐसा एक स्तरीकृत परीक्षण और सारांश अनुमान प्रदान करती है। ये टुकड़े लॉग-रैखिक और लॉजिस्टिक प्रतिगमन मॉडल में सामान्यीकृत होते हैं जो एक साथ कई श्रेणीबद्ध भविष्यवाणियों को संभालते हैं।
Clinical relevance
स्वास्थ्य विज्ञान में अधिकांश नैदानिक, रोगनिरोधी और जोखिम-कारक साक्ष्य श्रेणीबद्ध चरों के बीच संबंधों के रूप में रिपोर्ट किए जाते हैं — उजागर बनाम गैर-उजागर, घटना बनाम कोई घटना नहीं — इसलिए इस क्षेत्र की विधियाँ इस बात को रेखांकित करती हैं कि वह साक्ष्य कैसे उत्पन्न और मूल्यांकित किया जाता है। वे वर्णन करते हैं कि संबंधों को कैसे मापा और परीक्षण किया जाता है; वे अनुसंधान की व्याख्या करने के उपकरण हैं न कि व्यक्तिगत नैदानिक या उपचार निर्णयों का आधार।
Epidemiology
आकस्मिकता-तालिका विधियाँ महामारी विज्ञान की रोजमर्रा की मशीनरी हैं: सहकर्मी, केस-कंट्रोल और क्रॉस-सेक्शनल अध्ययन सभी, अपने सबसे सरल रूप में, परिणाम के विरुद्ध जोखिम की दो-गुणा-दो तालिका तक कम हो जाते हैं, और स्तरीकृत (मैन्टेल-हेन्ज़ेल) विश्लेषण प्रतिगमन से पहले भ्रमित करने के लिए शास्त्रीय गैर-मॉडल दृष्टिकोण है। यही विधियाँ बाइनरी एंडपॉइंट्स की रिपोर्ट करने वाले नैदानिक परीक्षणों और नैदानिक-परीक्षण मूल्यांकन में भी दोहराई जाती हैं।
History
इस क्षेत्र की शुरुआत बीसवीं सदी के मोड़ पर कार्ल पियर्सन के काई-वर्ग सांख्यिकी और आकस्मिकता तालिकाओं के लिए इसकी स्वतंत्रता की डिग्री के फिशर के 1922 के सुधार के साथ हुई, जिसके बाद छोटे नमूनों के लिए फिशर का सटीक परीक्षण आया। मध्य-सदी के महामारी विज्ञान ने प्रभाव-माप ढाँचा प्रदान किया — कॉर्नफ़ील्ड का विषम-अनुपात तर्क और 1959 का मैन्टेल-हेन्ज़ेल स्तरीकृत अनुमानक — और बाद की बीसवीं सदी ने इन विधियों को सामान्यीकृत-रैखिक-मॉडल ढाँचे के भीतर एकीकृत किया, जिसे एग्रेस्टी के पाठ्यपुस्तक उपचार में संश्लेषित किया गया।
Key figures
- Karl Pearson
- Ronald A. Fisher
- Jerome Cornfield
- Nathan Mantel
- William Haenszel
- Alan Agresti
- Joseph Fleiss
Related topics
Seminal works
- fisher-1922
- mantel-haenszel-1959
- agresti-2013
Frequently asked questions
- डेटा को “श्रेणीबद्ध” क्या बनाता है?
- डेटा श्रेणीबद्ध होता है जब प्रत्येक अवलोकन असतत वर्गों के एक सेट में से एक में आता है — जैसे रोगग्रस्त/स्वस्थ या उपचार शाखा A/B/C — बजाय एक मापा संख्यात्मक मान लेने के; विश्लेषण प्रत्येक वर्ग में गणनाओं के साथ काम करता है।
- यह क्षेत्र निरंतर परिणामों के लिए प्रतिगमन से कैसे भिन्न है?
- यहां परिणाम एक श्रेणी या एक गणना है, न कि एक निरंतर माप, इसलिए विधियाँ आकस्मिकता तालिकाओं, जोखिमों और विषमताओं के अनुपातों, और लॉजिस्टिक और लॉग-रैखिक प्रतिगमन जैसे मॉडलों पर केंद्रित हैं, न कि माध्य और सामान्य रैखिक प्रतिगमन पर।