सपोर्ट वेक्टर वर्गीकरण
सपोर्ट वेक्टर वर्गीकरण कक्षाओं को उस हाइपरप्लेन द्वारा अलग करता है जो निकटतम प्रशिक्षण बिंदुओं तक मार्जिन को अधिकतम करता है, जिसे कर्नेल के माध्यम से अरेखीय सीमाओं तक बढ़ाया जाता है।
Definition
सपोर्ट वेक्टर वर्गीकरण एक मार्जिन-आधारित विधि है जो प्रत्येक वर्ग के निकटतम प्रशिक्षण उदाहरणों से दूरी को अधिकतम करने वाली निर्णय सीमा का चयन करती है, वैकल्पिक रूप से कर्नेल-प्रेरित फीचर स्पेस में, मार्जिन चौड़ाई को वर्गीकरण त्रुटियों के साथ संतुलित करती है।
Scope
यह विषय अधिकतम-मार्जिन हाइपरप्लेन, सपोर्ट वेक्टर की भूमिका, गैर-विभाज्य डेटा के लिए स्लैक वैरिएबल के साथ सॉफ्ट-मार्जिन फॉर्मूलेशन, दोहरी अनुकूलन समस्या, और कर्नेल ट्रिक को शामिल करता है जो अरेखीय निर्णय सीमाएं प्राप्त करने के लिए सुविधाओं को अप्रत्यक्ष रूप से उच्च-आयामी स्थान में मैप करता है।
Core questions
- अलग करने वाली सीमाओं में से, कौन सी सबसे अच्छी तरह से सामान्यीकृत होती है?
- गैर-विभाज्य कक्षाओं को कैसे संभाला जाता है?
- कर्नेल ट्रिक स्पष्ट फीचर मैप के बिना अरेखीय सीमाएं कैसे उत्पन्न करती है?
- कौन से प्रशिक्षण बिंदु सीमा निर्धारित करते हैं?
Key theories
- अधिकतम-मार्जिन पृथक्करण
- निकटतम बिंदुओं तक मार्जिन को अधिकतम करने वाले पृथक्करण हाइपरप्लेन का चयन करने से एक सीमा प्राप्त होती है जो सपोर्ट वेक्टर के एक विरल सेट द्वारा निर्धारित होती है और सांख्यिकीय शिक्षण सिद्धांत से सामान्यीकरण सीमाओं से प्रेरित होती है।
- कर्नेल ट्रिक
- चूंकि अनुकूलन केवल आंतरिक उत्पादों के माध्यम से डेटा पर निर्भर करता है, उन्हें कर्नेल फ़ंक्शन के साथ बदलने से उच्च-आयामी फीचर स्पेस में अधिकतम-मार्जिन सीमा के अनुरूप होता है, जिससे रैखिक लागत पर अरेखीय क्लासिफायरियर मिलते हैं।
Clinical relevance
सपोर्ट वेक्टर मशीनें उच्च-आयामी वर्गीकरण जैसे पाठ वर्गीकरण, बायोइन्फॉर्मेटिक्स और छवि पहचान के लिए व्यापक रूप से उपयोग की जाती हैं, जहाँ मार्जिन सिद्धांत और कर्नेल कई विशेषताओं और जटिल सीमाओं को प्रभावी ढंग से संभालते हैं।
History
सपोर्ट वेक्टर वर्गीकरण सांख्यिकीय शिक्षण सिद्धांत से विकसित हुआ और 1995 में कोर्टेस और वापनिक के सपोर्ट-वेक्टर-नेटवर्क फॉर्मूलेशन में क्रिस्टलीकृत हुआ, जिसके बाद कर्नेल विधियाँ मशीन लर्निंग में एक केंद्रीय प्रतिमान बन गईं।
Debates
- कर्नेल और नियमितीकरण का चुनाव
- प्रदर्शन कर्नेल और मार्जिन की कोमलता को नियंत्रित करने वाले नियमितीकरण पैरामीटर पर बहुत अधिक निर्भर करता है; इन्हें ट्यून किया जाना चाहिए, और कोई सार्वभौमिक रूप से सबसे अच्छा विकल्प नहीं है।
Key figures
- Vladimir Vapnik
- Corinna Cortes
Related topics
Seminal works
- cortes1995
- hastie2009
- vapnik1998
Frequently asked questions
- सपोर्ट वेक्टर क्या हैं?
- वे प्रशिक्षण बिंदु हैं जो मार्जिन पर या उसके भीतर स्थित होते हैं जो निर्णय सीमा की स्थिति निर्धारित करते हैं; समाधान केवल इन बिंदुओं पर निर्भर करता है।
- सॉफ्ट मार्जिन का उपयोग क्यों करें?
- वास्तविक डेटा शायद ही कभी पूरी तरह से विभाज्य होता है, इसलिए सॉफ्ट-मार्जिन फॉर्मूलेशन कुछ बिंदुओं को व्यापक, अधिक मजबूत सीमा के बदले में मार्जिन का उल्लंघन करने की अनुमति देता है, जिसे एक नियमितीकरण पैरामीटर द्वारा नियंत्रित किया जाता है।