ScholarGate
सहायक

श्रेणीबद्ध डेटा विश्लेषण

श्रेणीबद्ध डेटा विश्लेषण बायोस्टैटिस्टिक्स की वह शाखा है जो ऐसे डेटा से संबंधित है जो निरंतर संख्यात्मक मान लेने के बजाय असतत श्रेणियों में आते हैं — जैसे किसी बीमारी का मौजूद होना या अनुपस्थित होना, किसी ट्यूमर का सौम्य या घातक होना, किसी मरीज को कई उपचार शाखाओं में से किसी एक में सौंपा जाना। इसका केंद्रीय उद्देश्य गणनाओं की आकस्मिकता तालिका (contingency table) है, और इसकी विधियाँ अन्य चरों को नियंत्रित करते हुए श्रेणीबद्ध चरों के बीच संबंधों का परीक्षण और मात्रा निर्धारण करती हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

श्रेणीबद्ध डेटा विश्लेषण सांख्यिकीय विधियों का एक समूह है जो उन चरों के बीच संबंधों का वर्णन, परीक्षण और मॉडलिंग करने के लिए है जिनके मान अव्यवस्थित या व्यवस्थित असतत श्रेणियों के भीतर गणनाएँ हैं, जिन्हें आमतौर पर आवृत्तियों की आकस्मिकता तालिकाओं के रूप में व्यवस्थित किया जाता है।

Scope

यह क्षेत्र पाठक को उन मुख्य विचारों से परिचित कराता है जो इसके नीचे के विषय पृष्ठों में बार-बार आते हैं: श्रेणीबद्ध अवलोकनों को आकस्मिकता तालिकाओं में कैसे व्यवस्थित किया जाता है, एक तालिका में संबंध का परीक्षण कैसे किया जाता है (काई-वर्ग और सटीक परीक्षण), एक संबंध को प्रभाव माप (जोखिम अनुपात और विषम अनुपात) द्वारा कैसे संक्षेपित किया जाता है, और एक भ्रमित करने वाले श्रेणीबद्ध चर को स्तरीकरण (Mantel-Haenszel methods) द्वारा कैसे नियंत्रित किया जाता है। यह इन्हें स्वास्थ्य अनुसंधान को पढ़ने और उत्पन्न करने के लिए कार्यप्रणाली उपकरणों के रूप में प्रस्तुत करता है, न कि नैदानिक मार्गदर्शन के रूप में।

Sub-topics

Core questions

  • क्या दो श्रेणीबद्ध चरों के बीच कोई संबंध है, या वे स्वतंत्र हैं?
  • जोखिमों या विषमताओं के अनुपात या अंतर के रूप में व्यक्त संबंध कितना बड़ा है?
  • क्या किसी तीसरे श्रेणीबद्ध चर पर स्तरीकरण के बाद एक स्पष्ट संबंध बना रहता है, या यह उसके द्वारा भ्रमित या संशोधित होता है?
  • जब कोशिका गणनाएँ छोटी होती हैं, तो कौन सी सटीक प्रक्रिया बड़े-नमूना सन्निकटन का स्थान लेती है?

Key concepts

  • गणनाओं की आकस्मिकता तालिका
  • श्रेणीबद्ध चरों की स्वतंत्रता
  • संबंध का काई-वर्ग परीक्षण
  • विरल तालिकाओं के लिए सटीक परीक्षण
  • प्रभाव माप: जोखिम अनुपात और विषम अनुपात
  • स्तरीकरण और मैन्टेल-हेन्ज़ेल अनुमानक
  • स्तरों में भ्रम और प्रभाव संशोधन
  • तालिकाओं के लिए लॉग-रैखिक और लॉजिस्टिक मॉडल

Mechanisms

श्रेणीबद्ध अवलोकनों को एक तालिका में क्रॉस-वर्गीकृत किया जाता है जिसकी कोशिकाओं में आवृत्तियाँ होती हैं। संबंध का एक परीक्षण प्रेक्षित कोशिका गणनाओं की तुलना उन गणनाओं से करता है जिनकी अपेक्षा की जाती है यदि पंक्ति और स्तंभ चर स्वतंत्र होते: पियर्सन का काई-वर्ग सांख्यिकी, जिसकी स्वतंत्रता की डिग्री के फिशर के स्पष्टीकरण द्वारा स्पर्शोन्मुख रूप से पुष्टि की जाती है, मानकीकृत अंतरों के वर्गों का योग करता है, जबकि सटीक परीक्षण तालिकाओं के सशर्त वितरण की गणना करते हैं जब गणनाएँ सन्निकटन के लिए बहुत कम होती हैं। संबंध की शक्ति को फिर तालिका से प्राप्त एक प्रभाव माप — एक जोखिम अनुपात या एक विषम अनुपात — द्वारा संक्षेपित किया जाता है। जब एक तीसरा चर संबंध को भ्रमित करने की धमकी देता है, तो डेटा को उस चर द्वारा परिभाषित स्तरों में विभाजित किया जाता है और स्तरों में एक संयुक्त अनुमान बनाया जाता है; मैन्टेल-हेन्ज़ेल प्रक्रिया ऐसा एक स्तरीकृत परीक्षण और सारांश अनुमान प्रदान करती है। ये टुकड़े लॉग-रैखिक और लॉजिस्टिक प्रतिगमन मॉडल में सामान्यीकृत होते हैं जो एक साथ कई श्रेणीबद्ध भविष्यवाणियों को संभालते हैं।

Clinical relevance

स्वास्थ्य विज्ञान में अधिकांश नैदानिक, रोगनिरोधी और जोखिम-कारक साक्ष्य श्रेणीबद्ध चरों के बीच संबंधों के रूप में रिपोर्ट किए जाते हैं — उजागर बनाम गैर-उजागर, घटना बनाम कोई घटना नहीं — इसलिए इस क्षेत्र की विधियाँ इस बात को रेखांकित करती हैं कि वह साक्ष्य कैसे उत्पन्न और मूल्यांकित किया जाता है। वे वर्णन करते हैं कि संबंधों को कैसे मापा और परीक्षण किया जाता है; वे अनुसंधान की व्याख्या करने के उपकरण हैं न कि व्यक्तिगत नैदानिक या उपचार निर्णयों का आधार।

Epidemiology

आकस्मिकता-तालिका विधियाँ महामारी विज्ञान की रोजमर्रा की मशीनरी हैं: सहकर्मी, केस-कंट्रोल और क्रॉस-सेक्शनल अध्ययन सभी, अपने सबसे सरल रूप में, परिणाम के विरुद्ध जोखिम की दो-गुणा-दो तालिका तक कम हो जाते हैं, और स्तरीकृत (मैन्टेल-हेन्ज़ेल) विश्लेषण प्रतिगमन से पहले भ्रमित करने के लिए शास्त्रीय गैर-मॉडल दृष्टिकोण है। यही विधियाँ बाइनरी एंडपॉइंट्स की रिपोर्ट करने वाले नैदानिक परीक्षणों और नैदानिक-परीक्षण मूल्यांकन में भी दोहराई जाती हैं।

History

इस क्षेत्र की शुरुआत बीसवीं सदी के मोड़ पर कार्ल पियर्सन के काई-वर्ग सांख्यिकी और आकस्मिकता तालिकाओं के लिए इसकी स्वतंत्रता की डिग्री के फिशर के 1922 के सुधार के साथ हुई, जिसके बाद छोटे नमूनों के लिए फिशर का सटीक परीक्षण आया। मध्य-सदी के महामारी विज्ञान ने प्रभाव-माप ढाँचा प्रदान किया — कॉर्नफ़ील्ड का विषम-अनुपात तर्क और 1959 का मैन्टेल-हेन्ज़ेल स्तरीकृत अनुमानक — और बाद की बीसवीं सदी ने इन विधियों को सामान्यीकृत-रैखिक-मॉडल ढाँचे के भीतर एकीकृत किया, जिसे एग्रेस्टी के पाठ्यपुस्तक उपचार में संश्लेषित किया गया।

Key figures

  • Karl Pearson
  • Ronald A. Fisher
  • Jerome Cornfield
  • Nathan Mantel
  • William Haenszel
  • Alan Agresti
  • Joseph Fleiss

Related topics

Seminal works

  • fisher-1922
  • mantel-haenszel-1959
  • agresti-2013

Frequently asked questions

डेटा को “श्रेणीबद्ध” क्या बनाता है?
डेटा श्रेणीबद्ध होता है जब प्रत्येक अवलोकन असतत वर्गों के एक सेट में से एक में आता है — जैसे रोगग्रस्त/स्वस्थ या उपचार शाखा A/B/C — बजाय एक मापा संख्यात्मक मान लेने के; विश्लेषण प्रत्येक वर्ग में गणनाओं के साथ काम करता है।
यह क्षेत्र निरंतर परिणामों के लिए प्रतिगमन से कैसे भिन्न है?
यहां परिणाम एक श्रेणी या एक गणना है, न कि एक निरंतर माप, इसलिए विधियाँ आकस्मिकता तालिकाओं, जोखिमों और विषमताओं के अनुपातों, और लॉजिस्टिक और लॉग-रैखिक प्रतिगमन जैसे मॉडलों पर केंद्रित हैं, न कि माध्य और सामान्य रैखिक प्रतिगमन पर।

Methods for this concept

Related concepts