सांख्यिकीय परिकल्पना परीक्षण
परिकल्पना परीक्षण डेटा से किसी जनसंख्या के बारे में प्रतिस्पर्धी कथनों के बीच निर्णय लेने का सिद्धांत है, जबकि प्रत्येक प्रकार की त्रुटि की संभावना को नियंत्रित किया जाता है।
Definition
एक सांख्यिकीय परिकल्पना परीक्षण एक नियम है जो नमूना डेटा का उपयोग यह तय करने के लिए करता है कि किसी वैकल्पिक परिकल्पना के पक्ष में एक शून्य परिकल्पना को अस्वीकार करना है या नहीं, जिसे इस तरह से डिज़ाइन किया गया है कि एक सही शून्य को गलत तरीके से अस्वीकार करने की संभावना एक चयनित महत्व स्तर से बंधी हो।
Scope
यह क्षेत्र शून्य और वैकल्पिक परिकल्पनाओं के निर्माण, दो प्रकार की त्रुटि और एक परीक्षण के आकार और शक्ति, सरल परिकल्पनाओं के सबसे शक्तिशाली परीक्षण के लिए नेमन-पियर्सन लेम्मा, मोनोटोन लाइक्लीहुड अनुपात और समान रूप से सबसे शक्तिशाली परीक्षण, निष्पक्ष और अपरिवर्तनीय परीक्षण, लाइक्लीहुड-अनुपात परीक्षण और इसका बड़े-नमूने का ची-स्क्वायर वितरण, p-मान और उनकी व्याख्या, और एक साथ कई परिकल्पनाओं के परीक्षण की समस्या को शामिल करता है।
Sub-topics
Core questions
- एक परीक्षण के आकार और शक्ति को कैसे परिभाषित किया जाता है, और दो प्रकार की त्रुटियों का व्यापार-बंद कैसे किया जाता है?
- दो सरल परिकल्पनाओं के बीच निर्णय लेने के लिए कौन सा परीक्षण सबसे शक्तिशाली है?
- एक-तरफा विकल्प के लिए समान रूप से सबसे शक्तिशाली परीक्षण कब मौजूद होता है?
- जब एक साथ कई परिकल्पनाओं का परीक्षण किया जाता है तो सार्थकता को कैसे नियंत्रित किया जाना चाहिए?
Key theories
- नेमन-पियर्सन लेम्मा
- दो सरल परिकल्पनाओं के लिए दिए गए आकार के सभी परीक्षणों में, लाइक्लीहुड-अनुपात परीक्षण जो अनुपात एक सीमा से अधिक होने पर अस्वीकार करता है, सबसे शक्तिशाली होता है।
- समान रूप से सबसे शक्तिशाली और निष्पक्ष परीक्षण
- मोनोटोन लाइक्लीहुड अनुपात वाले परिवारों के लिए एक ही परीक्षण एक तरफ हर विकल्प के खिलाफ सबसे शक्तिशाली होता है; जब ऐसा कोई परीक्षण मौजूद नहीं होता है, तो निष्पक्ष या अपरिवर्तनीय वर्गों के भीतर इष्टतमता की तलाश की जाती है।
- लाइक्लीहुड-अनुपात परीक्षण
- सामान्यीकृत लाइक्लीहुड-अनुपात सांख्यिकी शून्य और पूर्ण मॉडल के तहत अधिकतम लाइक्लीहुड की तुलना करती है; नियमितता के तहत इसका लघुगणक स्पर्शोन्मुख रूप से ची-स्क्वायर होता है, जो एक सामान्य-उद्देश्य परीक्षण प्रदान करता है।
Clinical relevance
परिकल्पना परीक्षण नैदानिक परीक्षणों, A/B परीक्षण, गुणवत्ता नियंत्रण और सिग्नल डिटेक्शन के मूल्यांकन को रेखांकित करते हैं, जहाँ गलत-सकारात्मक दरों को नियंत्रित करना और पर्याप्त शक्ति सुनिश्चित करना सीधे प्रभावित करता है कि कौन से हस्तक्षेप, उत्पाद या खोजें वास्तविक के रूप में स्वीकार किए जाते हैं।
History
फिशर ने 1920 के दशक में सार्थकता परीक्षण और p-मान विकसित किए। नेमन और पियर्सन ने 1933 में दो परिकल्पनाओं, त्रुटियों और शक्ति के निर्णय-सैद्धांतिक ढांचे की शुरुआत की, और लेहमैन के मध्य-शताब्दी के काम, जिसे रोमानो के साथ जारी रखा गया, ने परीक्षणों के इष्टतमता सिद्धांत को व्यवस्थित किया।
Debates
- फिशरियन सार्थकता बनाम नेमन-पियर्सन निर्णय
- फिशर ने p-मान को शून्य के खिलाफ साक्ष्य के एक सतत माप के रूप में देखा, जबकि नेमन और पियर्सन ने परीक्षण को निश्चित त्रुटि दरों के साथ एक निर्णय के रूप में तैयार किया; दोनों दर्शन अक्सर व्यवहार में मिश्रित होते हैं और अंतर अभी भी विवादित है।
Key figures
- Jerzy Neyman
- Egon Pearson
- Ronald A. Fisher
- Erich L. Lehmann
Related topics
Seminal works
- lehmannRomano2005
Frequently asked questions
- टाइप I और टाइप II त्रुटि में क्या अंतर है?
- टाइप I त्रुटि एक सही शून्य परिकल्पना को अस्वीकार करती है, एक गलत सकारात्मक; टाइप II त्रुटि एक गलत शून्य को अस्वीकार करने में विफल रहती है, एक गलत नकारात्मक। सार्थकता स्तर पहले को बांधता है और शक्ति दूसरे की संभावना से एक कम के बराबर होती है।
- क्या एक छोटा p-मान वैकल्पिक परिकल्पना को सिद्ध करता है?
- नहीं। एक छोटा p-मान इंगित करता है कि डेटा शून्य के तहत असंभव होगा; यह शून्य के खिलाफ एक सबूत है, न कि एक संभावना कि शून्य गलत है, और यह अपने आप में व्यावहारिक महत्व स्थापित नहीं करता है।