प्रतिचयन वितरण और केंद्रीय सीमा प्रमेय
प्रतिचयन वितरण (sampling distribution) एक सांख्यिकी (statistic) का प्रायिकता वितरण (probability distribution) है, जैसे कि एक नमूना माध्य (sample mean), जो दिए गए आकार के सभी संभावित नमूनों में होता है। केंद्रीय सीमा प्रमेय (central limit theorem) कहता है कि, पर्याप्त बड़े नमूनों के लिए, माध्य का प्रतिचयन वितरण अंतर्निहित डेटा के आकार की परवाह किए बिना लगभग सामान्य (normal) होता है। ये दोनों मिलकर बताते हैं कि सामान्य-आधारित विश्वास अंतराल (confidence intervals) और परीक्षण (tests) इतने व्यापक रूप से क्यों काम करते हैं।
Definition
प्रतिचयन वितरण एक सांख्यिकी के मानों का वितरण है जो एक जनसंख्या से निश्चित आकार के सभी संभावित नमूनों में प्राप्त होगा; केंद्रीय सीमा प्रमेय कहता है कि नमूना माध्य का प्रतिचयन वितरण नमूना आकार बढ़ने पर सामान्य वितरण के करीब पहुंचता है, चाहे जनसंख्या का आकार कुछ भी हो।
Scope
यह प्रविष्टि प्रतिचयन वितरण की अवधारणा, इसके फैलाव के रूप में मानक त्रुटि (standard error), केंद्रीय सीमा प्रमेय और नमूना आकार की भूमिका, और व्यक्तियों के मानक विचलन (standard deviation) तथा एक सांख्यिकी की मानक त्रुटि के बीच के अंतर को शामिल करती है। यह इन विचारों को विश्वास अंतराल और परिकल्पना परीक्षण (hypothesis testing) से जोड़ती है। यह एक पद्धतिगत संदर्भ है न कि नैदानिक मार्गदर्शन।
Core questions
- एक सांख्यिकी का प्रतिचयन वितरण क्या है और यह क्यों मायने रखता है?
- मानक त्रुटि मानक विचलन से कैसे भिन्न है?
- केंद्रीय सीमा प्रमेय क्या गारंटी देता है, और किन शर्तों के तहत?
- नमूना आकार एक अनुमान की सटीकता को कैसे प्रभावित करता है?
Key concepts
- सांख्यिकी बनाम प्राचल (parameter)
- प्रतिचयन वितरण
- मानक त्रुटि
- मानक त्रुटि बनाम मानक विचलन
- नमूना आकार और सटीकता
- माध्य की अनुमानित सामान्यता
- विश्वास अंतरालों और परीक्षणों का आधार
Key theories
- केंद्रीय सीमा प्रमेय
- परिमित विचरण वाली जनसंख्या से स्वतंत्र अवलोकनों के लिए, नमूना माध्य का वितरण नमूना आकार बढ़ने पर सामान्य वितरण की ओर प्रवृत्त होता है, चाहे जनसंख्या का आकार कुछ भी हो; यह माध्यों के लिए सामान्य-आधारित अनुमान को उचित ठहराता है, भले ही व्यक्तिगत माप गैर-सामान्य हों।
Mechanisms
यदि एक जनसंख्या से समान आकार के बार-बार नमूने लिए जाते, तो माध्य जैसी एक सांख्यिकी नमूने से नमूने में भिन्न होती; उन मानों का वितरण प्रतिचयन वितरण है, और इसका मानक विचलन मानक त्रुटि है। एक नमूना माध्य के लिए, मानक त्रुटि जनसंख्या मानक विचलन को नमूना आकार के वर्गमूल से विभाजित करने के बराबर होती है, इसलिए नमूने बढ़ने पर सटीकता में सुधार होता है, लेकिन केवल n के वर्गमूल के साथ। केंद्रीय सीमा प्रमेय यह भी कहता है कि, पर्याप्त बड़े नमूनों के लिए, यह प्रतिचयन वितरण लगभग सामान्य होता है, भले ही डेटा स्वयं विषम (skewed) हो, बशर्ते अवलोकन स्वतंत्र हों और विचरण (variance) परिमित हो। यह शास्त्रीय अनुमान का इंजन है: एक माध्य के लिए एक विश्वास अंतराल अनुमान से लगभग सामान्यता के तहत कई मानक त्रुटियों को बाहर निकालकर बनाया जाता है, और कई परिकल्पना परीक्षण एक अनुमान की तुलना उसके प्रतिचयन वितरण से करते हैं। मानक त्रुटि, जो नमूना आकार के साथ घटती है, को व्यक्तिगत अवलोकनों के मानक विचलन से अलग किया जाना चाहिए, जो जनसंख्या के फैलाव का अनुमान लगाता है और घटता नहीं है।
Clinical relevance
नैदानिक और सार्वजनिक स्वास्थ्य अध्ययनों में रिपोर्ट किए गए विश्वास अंतराल और p-मान अनुमान के प्रतिचयन वितरण और केंद्रीय सीमा प्रमेय पर आधारित होते हैं, इसलिए उन्हें समझना रिपोर्ट किए गए प्रभावों की सटीकता का आकलन करने में मदद करता है। यह प्रविष्टि पद्धतिगत पृष्ठभूमि है और व्यक्तिगत नैदानिक निर्णयों का आधार नहीं है।
History
केंद्रीय सीमा प्रमेय के शुरुआती रूप डी मोइवरे के द्विपद के सामान्य सन्निकटन (normal approximation to the binomial) में और लाप्लास के 1810 के आसपास के काम में दिखाई दिए, और कठोर सामान्य स्थितियां 1900 के आसपास ल्यापुनोव और अन्य द्वारा स्थापित की गईं। प्रतिचयन-वितरण दृष्टिकोण बीसवीं शताब्दी की शुरुआत में अनुमान के लिए केंद्रीय बन गया और बायोस्टैटिस्टिक्स में सामान्य-आधारित विश्वास अंतरालों और परीक्षणों के लिए मानक औचित्य बना हुआ है।
Debates
- केंद्रीय सीमा प्रमेय लागू होने के लिए एक नमूना कितना बड़ा होना चाहिए?
- सन्निकटन नमूना आकार के साथ बेहतर होता है, लेकिन कितना बड़ा पर्याप्त है यह इस बात पर निर्भर करता है कि डेटा कितना विषम है; अत्यधिक विषम वितरणों के लिए माध्य का वितरण स्वीकार्य रूप से सामान्य होने से पहले बहुत बड़े नमूनों की आवश्यकता होती है, इसलिए कोई एक सामान्य नियम सभी मामलों में फिट नहीं बैठता है।
Key figures
- Pierre-Simon Laplace
- Abraham de Moivre
- Aleksandr Lyapunov
Related topics
Seminal works
- altman-bland-2005-se
- rosner-2015
Frequently asked questions
- मानक विचलन और मानक त्रुटि में क्या अंतर है?
- एक मानक विचलन व्यक्तिगत अवलोकनों के फैलाव को मापता है, जबकि एक मानक त्रुटि नमूनों में एक सांख्यिकी, जैसे कि एक नमूना माध्य, के फैलाव को मापती है; नमूना आकार बढ़ने पर मानक त्रुटि घट जाती है, जबकि मानक विचलन एक निश्चित जनसंख्या मात्रा का अनुमान लगाता है।
- जब डेटा विषम हो तब भी हम माध्य के लिए सामान्य वितरण का उपयोग क्यों कर सकते हैं?
- केंद्रीय सीमा प्रमेय कहता है कि माध्य का प्रतिचयन वितरण डेटा के आकार की परवाह किए बिना नमूना आकार बढ़ने पर लगभग सामान्य हो जाता है, इसलिए माध्य के लिए सामान्य-आधारित विधियाँ अक्सर पर्याप्त बड़े नमूनों के साथ मान्य होती हैं, भले ही व्यक्तिगत मान सामान्य रूप से वितरित न हों।