मानक विचलन और मानक त्रुटि में क्या अंतर है?

एक मानक विचलन व्यक्तिगत अवलोकनों के फैलाव को मापता है, जबकि एक मानक त्रुटि नमूनों में एक सांख्यिकी, जैसे कि एक नमूना माध्य, के फैलाव को मापती है; नमूना आकार बढ़ने पर मानक त्रुटि घट जाती है, जबकि मानक विचलन एक निश्चित जनसंख्या मात्रा का अनुमान लगाता है।

जब डेटा विषम हो तब भी हम माध्य के लिए सामान्य वितरण का उपयोग क्यों कर सकते हैं?

केंद्रीय सीमा प्रमेय कहता है कि माध्य का प्रतिचयन वितरण डेटा के आकार की परवाह किए बिना नमूना आकार बढ़ने पर लगभग सामान्य हो जाता है, इसलिए माध्य के लिए सामान्य-आधारित विधियाँ अक्सर पर्याप्त बड़े नमूनों के साथ मान्य होती हैं, भले ही व्यक्तिगत मान सामान्य रूप से वितरित न हों।

प्रतिचयन वितरण और केंद्रीय सीमा प्रमेय

प्रतिचयन वितरण (sampling distribution) एक सांख्यिकी (statistic) का प्रायिकता वितरण (probability distribution) है, जैसे कि एक नमूना माध्य (sample mean), जो दिए गए आकार के सभी संभावित नमूनों में होता है। केंद्रीय सीमा प्रमेय (central limit theorem) कहता है कि, पर्याप्त बड़े नमूनों के लिए, माध्य का प्रतिचयन वितरण अंतर्निहित डेटा के आकार की परवाह किए बिना लगभग सामान्य (normal) होता है। ये दोनों मिलकर बताते हैं कि सामान्य-आधारित विश्वास अंतराल (confidence intervals) और परीक्षण (tests) इतने व्यापक रूप से क्यों काम करते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

प्रतिचयन वितरण एक सांख्यिकी के मानों का वितरण है जो एक जनसंख्या से निश्चित आकार के सभी संभावित नमूनों में प्राप्त होगा; केंद्रीय सीमा प्रमेय कहता है कि नमूना माध्य का प्रतिचयन वितरण नमूना आकार बढ़ने पर सामान्य वितरण के करीब पहुंचता है, चाहे जनसंख्या का आकार कुछ भी हो।

Scope

यह प्रविष्टि प्रतिचयन वितरण की अवधारणा, इसके फैलाव के रूप में मानक त्रुटि (standard error), केंद्रीय सीमा प्रमेय और नमूना आकार की भूमिका, और व्यक्तियों के मानक विचलन (standard deviation) तथा एक सांख्यिकी की मानक त्रुटि के बीच के अंतर को शामिल करती है। यह इन विचारों को विश्वास अंतराल और परिकल्पना परीक्षण (hypothesis testing) से जोड़ती है। यह एक पद्धतिगत संदर्भ है न कि नैदानिक मार्गदर्शन।

Core questions

एक सांख्यिकी का प्रतिचयन वितरण क्या है और यह क्यों मायने रखता है?
मानक त्रुटि मानक विचलन से कैसे भिन्न है?
केंद्रीय सीमा प्रमेय क्या गारंटी देता है, और किन शर्तों के तहत?
नमूना आकार एक अनुमान की सटीकता को कैसे प्रभावित करता है?

Key concepts

सांख्यिकी बनाम प्राचल (parameter)
प्रतिचयन वितरण
मानक त्रुटि
मानक त्रुटि बनाम मानक विचलन
नमूना आकार और सटीकता
माध्य की अनुमानित सामान्यता
विश्वास अंतरालों और परीक्षणों का आधार

Key theories

केंद्रीय सीमा प्रमेय: परिमित विचरण वाली जनसंख्या से स्वतंत्र अवलोकनों के लिए, नमूना माध्य का वितरण नमूना आकार बढ़ने पर सामान्य वितरण की ओर प्रवृत्त होता है, चाहे जनसंख्या का आकार कुछ भी हो; यह माध्यों के लिए सामान्य-आधारित अनुमान को उचित ठहराता है, भले ही व्यक्तिगत माप गैर-सामान्य हों।

Mechanisms

यदि एक जनसंख्या से समान आकार के बार-बार नमूने लिए जाते, तो माध्य जैसी एक सांख्यिकी नमूने से नमूने में भिन्न होती; उन मानों का वितरण प्रतिचयन वितरण है, और इसका मानक विचलन मानक त्रुटि है। एक नमूना माध्य के लिए, मानक त्रुटि जनसंख्या मानक विचलन को नमूना आकार के वर्गमूल से विभाजित करने के बराबर होती है, इसलिए नमूने बढ़ने पर सटीकता में सुधार होता है, लेकिन केवल n के वर्गमूल के साथ। केंद्रीय सीमा प्रमेय यह भी कहता है कि, पर्याप्त बड़े नमूनों के लिए, यह प्रतिचयन वितरण लगभग सामान्य होता है, भले ही डेटा स्वयं विषम (skewed) हो, बशर्ते अवलोकन स्वतंत्र हों और विचरण (variance) परिमित हो। यह शास्त्रीय अनुमान का इंजन है: एक माध्य के लिए एक विश्वास अंतराल अनुमान से लगभग सामान्यता के तहत कई मानक त्रुटियों को बाहर निकालकर बनाया जाता है, और कई परिकल्पना परीक्षण एक अनुमान की तुलना उसके प्रतिचयन वितरण से करते हैं। मानक त्रुटि, जो नमूना आकार के साथ घटती है, को व्यक्तिगत अवलोकनों के मानक विचलन से अलग किया जाना चाहिए, जो जनसंख्या के फैलाव का अनुमान लगाता है और घटता नहीं है।

Clinical relevance

नैदानिक और सार्वजनिक स्वास्थ्य अध्ययनों में रिपोर्ट किए गए विश्वास अंतराल और p-मान अनुमान के प्रतिचयन वितरण और केंद्रीय सीमा प्रमेय पर आधारित होते हैं, इसलिए उन्हें समझना रिपोर्ट किए गए प्रभावों की सटीकता का आकलन करने में मदद करता है। यह प्रविष्टि पद्धतिगत पृष्ठभूमि है और व्यक्तिगत नैदानिक निर्णयों का आधार नहीं है।

History

केंद्रीय सीमा प्रमेय के शुरुआती रूप डी मोइवरे के द्विपद के सामान्य सन्निकटन (normal approximation to the binomial) में और लाप्लास के 1810 के आसपास के काम में दिखाई दिए, और कठोर सामान्य स्थितियां 1900 के आसपास ल्यापुनोव और अन्य द्वारा स्थापित की गईं। प्रतिचयन-वितरण दृष्टिकोण बीसवीं शताब्दी की शुरुआत में अनुमान के लिए केंद्रीय बन गया और बायोस्टैटिस्टिक्स में सामान्य-आधारित विश्वास अंतरालों और परीक्षणों के लिए मानक औचित्य बना हुआ है।

Debates

केंद्रीय सीमा प्रमेय लागू होने के लिए एक नमूना कितना बड़ा होना चाहिए?: सन्निकटन नमूना आकार के साथ बेहतर होता है, लेकिन कितना बड़ा पर्याप्त है यह इस बात पर निर्भर करता है कि डेटा कितना विषम है; अत्यधिक विषम वितरणों के लिए माध्य का वितरण स्वीकार्य रूप से सामान्य होने से पहले बहुत बड़े नमूनों की आवश्यकता होती है, इसलिए कोई एक सामान्य नियम सभी मामलों में फिट नहीं बैठता है।

Key figures

Pierre-Simon Laplace
Abraham de Moivre
Aleksandr Lyapunov

Seminal works

altman-bland-2005-se
rosner-2015

Frequently asked questions

मानक विचलन और मानक त्रुटि में क्या अंतर है?: एक मानक विचलन व्यक्तिगत अवलोकनों के फैलाव को मापता है, जबकि एक मानक त्रुटि नमूनों में एक सांख्यिकी, जैसे कि एक नमूना माध्य, के फैलाव को मापती है; नमूना आकार बढ़ने पर मानक त्रुटि घट जाती है, जबकि मानक विचलन एक निश्चित जनसंख्या मात्रा का अनुमान लगाता है।
जब डेटा विषम हो तब भी हम माध्य के लिए सामान्य वितरण का उपयोग क्यों कर सकते हैं?: केंद्रीय सीमा प्रमेय कहता है कि माध्य का प्रतिचयन वितरण डेटा के आकार की परवाह किए बिना नमूना आकार बढ़ने पर लगभग सामान्य हो जाता है, इसलिए माध्य के लिए सामान्य-आधारित विधियाँ अक्सर पर्याप्त बड़े नमूनों के साथ मान्य होती हैं, भले ही व्यक्तिगत मान सामान्य रूप से वितरित न हों।