डेटा को “श्रेणीबद्ध” क्या बनाता है?

डेटा श्रेणीबद्ध होता है जब प्रत्येक अवलोकन असतत वर्गों के एक सेट में से एक में आता है — जैसे रोगग्रस्त/स्वस्थ या उपचार शाखा A/B/C — बजाय एक मापा संख्यात्मक मान लेने के; विश्लेषण प्रत्येक वर्ग में गणनाओं के साथ काम करता है।

यह क्षेत्र निरंतर परिणामों के लिए प्रतिगमन से कैसे भिन्न है?

यहां परिणाम एक श्रेणी या एक गणना है, न कि एक निरंतर माप, इसलिए विधियाँ आकस्मिकता तालिकाओं, जोखिमों और विषमताओं के अनुपातों, और लॉजिस्टिक और लॉग-रैखिक प्रतिगमन जैसे मॉडलों पर केंद्रित हैं, न कि माध्य और सामान्य रैखिक प्रतिगमन पर।

श्रेणीबद्ध डेटा विश्लेषण

श्रेणीबद्ध डेटा विश्लेषण बायोस्टैटिस्टिक्स की वह शाखा है जो ऐसे डेटा से संबंधित है जो निरंतर संख्यात्मक मान लेने के बजाय असतत श्रेणियों में आते हैं — जैसे किसी बीमारी का मौजूद होना या अनुपस्थित होना, किसी ट्यूमर का सौम्य या घातक होना, किसी मरीज को कई उपचार शाखाओं में से किसी एक में सौंपा जाना। इसका केंद्रीय उद्देश्य गणनाओं की आकस्मिकता तालिका (contingency table) है, और इसकी विधियाँ अन्य चरों को नियंत्रित करते हुए श्रेणीबद्ध चरों के बीच संबंधों का परीक्षण और मात्रा निर्धारण करती हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

श्रेणीबद्ध डेटा विश्लेषण सांख्यिकीय विधियों का एक समूह है जो उन चरों के बीच संबंधों का वर्णन, परीक्षण और मॉडलिंग करने के लिए है जिनके मान अव्यवस्थित या व्यवस्थित असतत श्रेणियों के भीतर गणनाएँ हैं, जिन्हें आमतौर पर आवृत्तियों की आकस्मिकता तालिकाओं के रूप में व्यवस्थित किया जाता है।

Scope

यह क्षेत्र पाठक को उन मुख्य विचारों से परिचित कराता है जो इसके नीचे के विषय पृष्ठों में बार-बार आते हैं: श्रेणीबद्ध अवलोकनों को आकस्मिकता तालिकाओं में कैसे व्यवस्थित किया जाता है, एक तालिका में संबंध का परीक्षण कैसे किया जाता है (काई-वर्ग और सटीक परीक्षण), एक संबंध को प्रभाव माप (जोखिम अनुपात और विषम अनुपात) द्वारा कैसे संक्षेपित किया जाता है, और एक भ्रमित करने वाले श्रेणीबद्ध चर को स्तरीकरण (Mantel-Haenszel methods) द्वारा कैसे नियंत्रित किया जाता है। यह इन्हें स्वास्थ्य अनुसंधान को पढ़ने और उत्पन्न करने के लिए कार्यप्रणाली उपकरणों के रूप में प्रस्तुत करता है, न कि नैदानिक मार्गदर्शन के रूप में।

Sub-topics

Core questions

क्या दो श्रेणीबद्ध चरों के बीच कोई संबंध है, या वे स्वतंत्र हैं?
जोखिमों या विषमताओं के अनुपात या अंतर के रूप में व्यक्त संबंध कितना बड़ा है?
क्या किसी तीसरे श्रेणीबद्ध चर पर स्तरीकरण के बाद एक स्पष्ट संबंध बना रहता है, या यह उसके द्वारा भ्रमित या संशोधित होता है?
जब कोशिका गणनाएँ छोटी होती हैं, तो कौन सी सटीक प्रक्रिया बड़े-नमूना सन्निकटन का स्थान लेती है?

Key concepts

गणनाओं की आकस्मिकता तालिका
श्रेणीबद्ध चरों की स्वतंत्रता
संबंध का काई-वर्ग परीक्षण
विरल तालिकाओं के लिए सटीक परीक्षण
प्रभाव माप: जोखिम अनुपात और विषम अनुपात
स्तरीकरण और मैन्टेल-हेन्ज़ेल अनुमानक
स्तरों में भ्रम और प्रभाव संशोधन
तालिकाओं के लिए लॉग-रैखिक और लॉजिस्टिक मॉडल

Mechanisms

श्रेणीबद्ध अवलोकनों को एक तालिका में क्रॉस-वर्गीकृत किया जाता है जिसकी कोशिकाओं में आवृत्तियाँ होती हैं। संबंध का एक परीक्षण प्रेक्षित कोशिका गणनाओं की तुलना उन गणनाओं से करता है जिनकी अपेक्षा की जाती है यदि पंक्ति और स्तंभ चर स्वतंत्र होते: पियर्सन का काई-वर्ग सांख्यिकी, जिसकी स्वतंत्रता की डिग्री के फिशर के स्पष्टीकरण द्वारा स्पर्शोन्मुख रूप से पुष्टि की जाती है, मानकीकृत अंतरों के वर्गों का योग करता है, जबकि सटीक परीक्षण तालिकाओं के सशर्त वितरण की गणना करते हैं जब गणनाएँ सन्निकटन के लिए बहुत कम होती हैं। संबंध की शक्ति को फिर तालिका से प्राप्त एक प्रभाव माप — एक जोखिम अनुपात या एक विषम अनुपात — द्वारा संक्षेपित किया जाता है। जब एक तीसरा चर संबंध को भ्रमित करने की धमकी देता है, तो डेटा को उस चर द्वारा परिभाषित स्तरों में विभाजित किया जाता है और स्तरों में एक संयुक्त अनुमान बनाया जाता है; मैन्टेल-हेन्ज़ेल प्रक्रिया ऐसा एक स्तरीकृत परीक्षण और सारांश अनुमान प्रदान करती है। ये टुकड़े लॉग-रैखिक और लॉजिस्टिक प्रतिगमन मॉडल में सामान्यीकृत होते हैं जो एक साथ कई श्रेणीबद्ध भविष्यवाणियों को संभालते हैं।

Clinical relevance

स्वास्थ्य विज्ञान में अधिकांश नैदानिक, रोगनिरोधी और जोखिम-कारक साक्ष्य श्रेणीबद्ध चरों के बीच संबंधों के रूप में रिपोर्ट किए जाते हैं — उजागर बनाम गैर-उजागर, घटना बनाम कोई घटना नहीं — इसलिए इस क्षेत्र की विधियाँ इस बात को रेखांकित करती हैं कि वह साक्ष्य कैसे उत्पन्न और मूल्यांकित किया जाता है। वे वर्णन करते हैं कि संबंधों को कैसे मापा और परीक्षण किया जाता है; वे अनुसंधान की व्याख्या करने के उपकरण हैं न कि व्यक्तिगत नैदानिक या उपचार निर्णयों का आधार।

Epidemiology

आकस्मिकता-तालिका विधियाँ महामारी विज्ञान की रोजमर्रा की मशीनरी हैं: सहकर्मी, केस-कंट्रोल और क्रॉस-सेक्शनल अध्ययन सभी, अपने सबसे सरल रूप में, परिणाम के विरुद्ध जोखिम की दो-गुणा-दो तालिका तक कम हो जाते हैं, और स्तरीकृत (मैन्टेल-हेन्ज़ेल) विश्लेषण प्रतिगमन से पहले भ्रमित करने के लिए शास्त्रीय गैर-मॉडल दृष्टिकोण है। यही विधियाँ बाइनरी एंडपॉइंट्स की रिपोर्ट करने वाले नैदानिक परीक्षणों और नैदानिक-परीक्षण मूल्यांकन में भी दोहराई जाती हैं।

History

इस क्षेत्र की शुरुआत बीसवीं सदी के मोड़ पर कार्ल पियर्सन के काई-वर्ग सांख्यिकी और आकस्मिकता तालिकाओं के लिए इसकी स्वतंत्रता की डिग्री के फिशर के 1922 के सुधार के साथ हुई, जिसके बाद छोटे नमूनों के लिए फिशर का सटीक परीक्षण आया। मध्य-सदी के महामारी विज्ञान ने प्रभाव-माप ढाँचा प्रदान किया — कॉर्नफ़ील्ड का विषम-अनुपात तर्क और 1959 का मैन्टेल-हेन्ज़ेल स्तरीकृत अनुमानक — और बाद की बीसवीं सदी ने इन विधियों को सामान्यीकृत-रैखिक-मॉडल ढाँचे के भीतर एकीकृत किया, जिसे एग्रेस्टी के पाठ्यपुस्तक उपचार में संश्लेषित किया गया।

Key figures

Karl Pearson
Ronald A. Fisher
Jerome Cornfield
Nathan Mantel
William Haenszel
Alan Agresti
Joseph Fleiss

Seminal works

fisher-1922
mantel-haenszel-1959
agresti-2013

Frequently asked questions

डेटा को “श्रेणीबद्ध” क्या बनाता है?: डेटा श्रेणीबद्ध होता है जब प्रत्येक अवलोकन असतत वर्गों के एक सेट में से एक में आता है — जैसे रोगग्रस्त/स्वस्थ या उपचार शाखा A/B/C — बजाय एक मापा संख्यात्मक मान लेने के; विश्लेषण प्रत्येक वर्ग में गणनाओं के साथ काम करता है।
यह क्षेत्र निरंतर परिणामों के लिए प्रतिगमन से कैसे भिन्न है?: यहां परिणाम एक श्रेणी या एक गणना है, न कि एक निरंतर माप, इसलिए विधियाँ आकस्मिकता तालिकाओं, जोखिमों और विषमताओं के अनुपातों, और लॉजिस्टिक और लॉग-रैखिक प्रतिगमन जैसे मॉडलों पर केंद्रित हैं, न कि माध्य और सामान्य रैखिक प्रतिगमन पर।