रिग्रेशन और सहसंबंध
रिग्रेशन और सहसंबंध यह निर्धारित करने के लिए मुख्य बायोस्टैटिस्टिकल उपकरण हैं कि चर एक दूसरे से कैसे संबंधित हैं। सहसंबंध दो मात्राओं के बीच संबंध की शक्ति और दिशा को मापता है, जबकि रिग्रेशन यह मॉडल करता है कि एक परिणाम कैसे बदलता है क्योंकि एक या अधिक व्याख्यात्मक चर बदलते हैं, जो स्पष्टीकरण और भविष्यवाणी दोनों का समर्थन करता है। साथ में वे स्वास्थ्य विज्ञान में रिपोर्ट किए गए अधिकांश बहुभिन्नरूपी विश्लेषणों को रेखांकित करते हैं।
Definition
रिग्रेशन और सहसंबंध में सांख्यिकीय विधियाँ शामिल हैं जो चरों के बीच संबंध (सहसंबंध और सहप्रसरण) को सारांशित करती हैं और जो एक परिणाम को एक या अधिक व्याख्यात्मक चरों (रिग्रेशन) से संबंधित एक फ़ंक्शन का अनुमान लगाती हैं, ताकि परिणाम को समझाया जा सके, भ्रमित करने वालों के लिए समायोजित किया जा सके, या भविष्यवाणी की जा सके।
Scope
यह क्षेत्र पाठक को संघ का वर्णन करने और भविष्यवाणियों से परिणामों को मॉडल करने के लिए उपयोग की जाने वाली विधियों के परिवार में उन्मुख करता है: सहसंबंध और सहप्रसरण, निरंतर परिणामों के लिए सरल और बहु रैखिक रिग्रेशन, बाइनरी परिणामों के लिए लॉजिस्टिक रिग्रेशन, और मॉडल चयन और निदान की क्रॉस-कटिंग चिंताएं। यह नैदानिक मार्गदर्शन के बजाय एक पद्धतिगत मानचित्र है, और यह व्यक्तिगत विषय प्रविष्टियों से जुड़ता है जहां प्रत्येक विधि को विस्तार से विकसित किया गया है।
Sub-topics
Core questions
- दो चर कितनी दृढ़ता से, और किस दिशा में, संबंधित हैं?
- एक व्याख्यात्मक चर के बदलने पर एक परिणाम कैसे बदलता है, अन्य चरों को स्थिर रखते हुए?
- कौन सा मॉडल फॉर्म (रैखिक, लॉजिस्टिक, या अन्य) विश्लेषण किए जा रहे परिणाम के प्रकार से मेल खाता है?
- रिग्रेशन गुणांकों की व्याख्या प्रभावों या भविष्यवाणियों के रूप में कैसे की जाती है?
- एक फिट किए गए मॉडल की जांच, चयन और ओवरफिटिंग से कैसे रोका जाता है?
Key concepts
- सहप्रसरण और सहसंबंध गुणांक
- न्यूनतम-वर्ग अनुमान
- रिग्रेशन गुणांक (ढलान) और अवरोधन
- बहु रिग्रेशन के माध्यम से समायोजन और भ्रम नियंत्रण
- लिंक फ़ंक्शन और सामान्यीकृत रैखिक मॉडल फ्रेमवर्क
- भविष्यवाणी बनाम स्पष्टीकरण
- ओवरफिटिंग और मॉडल सत्यापन
- अवशेष और मॉडल निदान
Mechanisms
सहसंबंध दो चरों की संयुक्त भिन्नता (उनका सहप्रसरण) को -1 और +1 के बीच एक स्केल-मुक्त गुणांक तक कम कर देता है। रिग्रेशन एक फ़ंक्शन को फिट करके आगे बढ़ता है - अक्सर एक रेखा या भारित भविष्यवाणियों का योग - जो भविष्यवाणियों को देखते हुए एक परिणाम के अपेक्षित मूल्य का वर्णन करता है। रैखिक रिग्रेशन न्यूनतम वर्गों द्वारा निरंतर परिणामों के लिए इस फ़ंक्शन का अनुमान लगाता है; लॉजिस्टिक और अन्य सामान्यीकृत रैखिक मॉडल एक लिंक फ़ंक्शन के माध्यम से बाइनरी, गणना और अन्य परिणाम प्रकारों के लिए उसी विचार का विस्तार करते हैं जो रैखिक भविष्यवक्ता को परिणाम पैमाने से जोड़ता है। इन सभी में, गुणांक ठोस व्याख्या करते हैं, और निदान यह जांचते हैं कि उस व्याख्या को सही ठहराने वाली धारणाएं मान्य हैं या नहीं।
Clinical relevance
नैदानिक और सार्वजनिक-स्वास्थ्य अनुसंधान में अधिकांश मात्रात्मक निष्कर्ष - समायोजित संघ, जोखिम कारक, खुराक-प्रतिक्रिया संबंध, और भविष्यवाणी मॉडल - रिग्रेशन द्वारा उत्पादित होते हैं। यह समझना कि इन मॉडलों का निर्माण और व्याख्या कैसे की जाती है, साहित्य का गंभीर रूप से मूल्यांकन करने का एक हिस्सा है। यह क्षेत्र बताता है कि ऐसे साक्ष्य कैसे उत्पन्न होते हैं और व्यक्तिगत निदान या उपचार निर्णयों का आधार नहीं है।
Evidence & guidelines
रिग्रेशन-आधारित अध्ययनों के लिए रिपोर्टिंग मार्गदर्शन में अवलोकन संबंधी अध्ययनों के लिए STROBE कथन और भविष्यवाणी-मॉडल अध्ययनों के लिए TRIPOD कथन शामिल हैं; हैरेल और विटिंगहॉफ और सहयोगियों जैसे मानक पाठ्यपुस्तक उपचार अनुशंसित मॉडलिंग रणनीति निर्धारित करते हैं। पद्धतिगत टिप्पणी निरंतर भविष्यवाणियों को द्विभाजित करने जैसी परिहार्य प्रथाओं के खिलाफ सावधानी बरतती है, जो जानकारी को त्याग देती है और अनुमानित प्रभावों को विकृत कर सकती है।
History
सहसंबंध और रिग्रेशन की उत्पत्ति फ्रांसिस गाल्टन के उन्नीसवीं सदी के अंत में आनुवंशिकता के अध्ययनों में हुई है, जहाँ उन्होंने 'माध्य की ओर रिग्रेशन' का वर्णन किया था, और कार्ल पियर्सन द्वारा औपचारिक आधार पर रखा गया था। बीसवीं शताब्दी ने रैखिक मॉडल को कई भविष्यवाणियों तक विस्तारित किया, और सामान्यीकृत रैखिक मॉडल फ्रेमवर्क ने बाद में रैखिक, लॉजिस्टिक और संबंधित मॉडलों को एकीकृत किया। बायोस्टैटिस्टिक्स में ये विधियाँ समायोजित विश्लेषण और जोखिम भविष्यवाणी के लिए मानक उपकरण बन गईं।
Key figures
- Francis Galton
- Karl Pearson
- David Cox
- Frank Harrell
- Douglas Altman
Related topics
Seminal works
- altman-bland-2005
- harrell-2015
Frequently asked questions
- सहसंबंध और रिग्रेशन में क्या अंतर है?
- सहसंबंध एक एकल सममित गुणांक में दो चरों के बीच संबंध की शक्ति और दिशा को सारांशित करता है, जबकि रिग्रेशन यह मॉडल करता है कि एक परिणाम एक या अधिक भविष्यवाणियों पर कैसे निर्भर करता है और गुणांक उत्पन्न करता है जिनका उपयोग समायोजन या भविष्यवाणी के लिए किया जा सकता है। सहसंबंध परिणाम को भविष्यवक्ता से अलग नहीं करता है; रिग्रेशन करता है।
- किस रिग्रेशन मॉडल का उपयोग किया जाना चाहिए?
- विकल्प परिणाम के प्रकार का अनुसरण करता है: एक निरंतर परिणाम के लिए रैखिक रिग्रेशन, एक बाइनरी परिणाम के लिए लॉजिस्टिक रिग्रेशन, और गणना या घटना-समय डेटा के लिए अन्य सामान्यीकृत रैखिक या उत्तरजीविता मॉडल। व्यक्तिगत विषय प्रविष्टियाँ प्रत्येक का विस्तार से वर्णन करती हैं।