वीसी आयाम और क्षमता
वैपनिक-चेर्वोनेंकिस आयाम एक मॉडल वर्ग की क्षमता को उस सबसे बड़े बिंदु समूह द्वारा मापता है जिसे वह सभी संभावित तरीकों से लेबल कर सकता है, यह मात्रा निर्धारित करता है कि एक सीखने वाला कितना जटिल है।
Definition
क्लासिफायर के एक वर्ग का वैपनिक-चेर्वोनेंकिस आयाम बिंदुओं की सबसे बड़ी संख्या है जिसे वर्ग हर संभव तरीके से लेबल कर सकता है; यह क्षमता का एक माप है जो यह सीमित करता है कि वर्ग कितना अधिक फिट हो सकता है और इसलिए विश्वसनीय रूप से सीखने के लिए कितने डेटा की आवश्यकता है।
Scope
यह विषय एक परिकल्पना वर्ग की समृद्धि के उपायों को शामिल करता है: बिंदुओं के एक समूह को खंडित करने की धारणा, वैपनिक-चेर्वोनेंकिस आयाम सबसे बड़े खंडित समूह के आकार के रूप में, वृद्धि कार्य, और ये क्षमता माप सामान्यीकरण सीमाओं में कैसे प्रवेश करते हैं। यह बताता है कि केवल मापदंडों की संख्या के बजाय क्षमता ही सामान्यीकरण करने की क्षमता को क्यों नियंत्रित करती है।
Core questions
- एक मॉडल वर्ग के लिए बिंदुओं के एक समूह को खंडित करने का क्या अर्थ है?
- वैपनिक-चेर्वोनेंकिस आयाम को कैसे परिभाषित और गणना किया जाता है?
- क्षमता मापदंडों की संख्या के बजाय सामान्यीकरण को क्यों नियंत्रित करती है?
- प्रशिक्षण और वास्तविक त्रुटि के बीच के अंतर पर सीमाओं में क्षमता कैसे प्रवेश करती है?
Key theories
- खंडन और क्षमता
- एक वर्ग बिंदुओं के एक समूह को खंडित करता है यदि वह उनके हर संभव लेबलिंग को महसूस कर सकता है; ऐसा सबसे बड़ा समूह वैपनिक-चेर्वोनेंकिस आयाम को परिभाषित करता है, जो वर्ग कितना लचीला है इसका एक वितरण-मुक्त माप है।
- क्षमता एकसमान अभिसरण को नियंत्रित करती है
- परिमित क्षमता यह सुनिश्चित करती है कि अनुभवजन्य त्रुटि वर्ग पर समान रूप से वास्तविक त्रुटि में परिवर्तित हो जाती है, इसलिए सीमित वैपनिक-चेर्वोनेंकिस आयाम वाला एक सीखने वाला डेटा बढ़ने पर मनमाने ढंग से अधिक फिट नहीं हो सकता है।
- क्षमता बनाम मापदंडों की संख्या
- क्षमता, न कि मापदंडों की कच्ची संख्या, सामान्यीकरण निर्धारित करती है, इसलिए समान मापदंडों की संख्या वाले दो मॉडल को आवश्यक डेटा की मात्रा में बहुत भिन्नता हो सकती है।
Clinical relevance
वैपनिक-चेर्वोनेंकिस आयाम शास्त्रीय शिक्षण सिद्धांत का केंद्रीय क्षमता माप प्रदान करता है और मॉडल जटिलता को नियंत्रित करने की प्रथा को उचित ठहराता है; यह सपोर्ट वेक्टर मशीनों के मार्जिन-आधारित विश्लेषण का आधार है और यह समझने के लिए चल रहे प्रयासों को तैयार करता है कि कुछ बहुत उच्च-क्षमता वाले मॉडल फिर भी सामान्यीकरण क्यों करते हैं।
History
वैपनिक और चेर्वोनेंकिस ने 1960 के दशक के अंत के काम और एकसमान अभिसरण पर 1971 के पेपर में उस आयाम को पेश किया जो उनके नाम पर है, क्षमता का एक वितरण-मुक्त सिद्धांत स्थापित किया। यह अवधारणा सपोर्ट वेक्टर मशीनों और सामान्यीकरण के व्यापक विश्लेषण के लिए मौलिक बन गई।
Key figures
- Vladimir Vapnik
- Alexey Chervonenkis
Related topics
Seminal works
- vapnik1971
- vapnik1995
- hastie2009
Frequently asked questions
- खंडन का क्या अर्थ है?
- बिंदुओं का एक समूह एक मॉडल वर्ग द्वारा खंडित होता है यदि उन बिंदुओं को लेबल के हर संभव असाइनमेंट के लिए, वर्ग में कुछ मॉडल ठीक उसी लेबलिंग का उत्पादन करते हैं। सबसे बड़े खंडित होने योग्य समूह का आकार वैपनिक-चेर्वोनेंकिस आयाम है।
- क्या अधिक मापदंडों वाला मॉडल हमेशा उच्च क्षमता वाला होता है?
- ज़रूरी नहीं। क्षमता को वैपनिक-चेर्वोनेंकिस आयाम या संबंधित मात्राओं द्वारा मापा जाता है, जो मापदंडों की संख्या से भिन्न हो सकती हैं। सामान्यीकरण के लिए जटिलता का सही माप क्षमता है, न कि केवल एक मॉडल में कितने मापदंड हैं।