वर्गीकरण एल्गोरिदम
वर्गीकरण एल्गोरिदम लेबल किए गए उदाहरणों से निर्णय सीमाओं या वर्ग-संभाव्यता अनुमानों को सीखकर इनपुट को श्रेणियों के एक सीमित सेट में से एक को निर्दिष्ट करते हैं।
Definition
एक वर्गीकरण एल्गोरिदम, इनपुट-लेबल युग्मों से, एक नियम सीखता है जो प्रत्येक नए इनपुट को एक असतत वर्ग में मैप करता है; जनरेटिव दृष्टिकोण प्रत्येक वर्ग के भीतर इनपुट के वितरण को मॉडल करते हैं और बेयस के नियम को लागू करते हैं, जबकि विभेदक दृष्टिकोण सीधे वर्ग सीमा या पश्च संभाव्यता को मॉडल करते हैं।
Scope
यह विषय श्रेणीबद्ध लेबलों की भविष्यवाणी के पर्यवेक्षित कार्य को शामिल करता है: संभाव्य जनरेटिव क्लासिफायर जैसे कि नैव बेयस और गाऊसी विभेदक विश्लेषण, विभेदक क्लासिफायर जैसे कि लॉजिस्टिक रिग्रेशन, इंस्टेंस-आधारित विधियाँ जैसे कि k-निकटतम पड़ोसी, और निर्णय सीमा, पश्च वर्ग संभाव्यता, और त्रुटि को कम करने वाले बेयस-इष्टतम क्लासिफायर की अवधारणाएँ।
Core questions
- लेबल किए गए डेटा से वर्गों के बीच एक निर्णय सीमा का अनुमान कैसे लगाया जाता है?
- एक क्लासिफायर को सीधे पश्च के बजाय वर्ग-सशर्त वितरण को कब मॉडल करना चाहिए?
- बेयस-इष्टतम त्रुटि क्या है और एक सीखा हुआ क्लासिफायर इसके कितने करीब आ सकता है?
- बहु-वर्ग समस्याओं को बाइनरी वर्गीकरण के साथ कैसे कम किया जाता है या हल किया जाता है?
Key theories
- बेयस-इष्टतम वर्गीकरण
- प्रत्येक इनपुट को उच्चतम पश्च संभाव्यता वाले वर्ग को निर्दिष्ट करना अपेक्षित गलत वर्गीकरण त्रुटि को कम करता है, जो सैद्धांतिक इष्टतम को परिभाषित करता है जिसे व्यावहारिक क्लासिफायर अनुमानित करते हैं।
- जनरेटिव बनाम विभेदक मॉडल
- नैव बेयस और विभेदक विश्लेषण मॉडल करते हैं कि प्रति वर्ग डेटा कैसे उत्पन्न होता है, जबकि लॉजिस्टिक रिग्रेशन सीधे वर्ग पश्च को मॉडल करता है, एक अंतर जो डेटा दक्षता और मॉडल मिसस्पेसिफिकेशन के प्रति मजबूती को प्रभावित करता है।
- निकटतम-पड़ोसी वर्गीकरण
- आस-पास के प्रशिक्षण बिंदुओं के लेबलों द्वारा वर्गीकरण एक सरल गैर-पैरामीट्रिक नियम है जिसकी त्रुटि बेयस त्रुटि के अधिकतम दोगुने से स्पर्शोन्मुख रूप से बंधी होती है, यह दर्शाता है कि कैसे केवल स्थानीय जानकारी शक्तिशाली हो सकती है।
Clinical relevance
वर्गीकरण अनुप्रयुक्त मशीन लर्निंग का मुख्य आधार है, जो ईमेल स्पैम डिटेक्शन, भावना विश्लेषण, छवि लेबलिंग, धोखाधड़ी का पता लगाने और कंप्यूटर-सहायता प्राप्त निदान के पीछे है; बेयस इष्टतम और जनरेटिव-विभेदक भेद को समझना विधि के चुनाव और वर्ग-संभाव्यता आउटपुट की व्याख्या का मार्गदर्शन करता है।
History
प्रारंभिक क्लासिफायर में फिशर का रैखिक विभेदक और कवर और हार्ट द्वारा 1967 में विश्लेषण किया गया निकटतम-पड़ोसी नियम शामिल थे। लॉजिस्टिक रिग्रेशन सांख्यिकी से मशीन लर्निंग में स्थानांतरित हो गया, और नैव बेयस और विभेदक विश्लेषण मानक संभाव्य बेसलाइन बन गए, जो सभी बाद में पश्च वर्ग संभाव्यताओं का अनुमान लगाने के ढांचे के भीतर एकीकृत हो गए।
Key figures
- Thomas Cover
- Peter Hart
- Christopher Bishop
Related topics
Seminal works
- cover1967
- bishop2006
- hastie2009
Frequently asked questions
- क्या लॉजिस्टिक रिग्रेशन एक रिग्रेशन है या एक वर्गीकरण विधि है?
- अपने नाम के बावजूद, लॉजिस्टिक रिग्रेशन का उपयोग वर्गीकरण के लिए किया जाता है। यह उस संभाव्यता को मॉडल करता है कि एक इनपुट एक वर्ग से संबंधित है, और एक निर्णय नियम फिर उस संभाव्यता को एक अनुमानित लेबल में परिवर्तित करता है।
- k-निकटतम पड़ोसियों को प्रशिक्षण चरण की आवश्यकता क्यों नहीं होती है?
- k-निकटतम पड़ोसी प्रशिक्षण डेटा को संग्रहीत करता है और भविष्यवाणी के समय अपने निकटतम संग्रहीत उदाहरणों को देखकर एक नए बिंदु को वर्गीकृत करता है। कोई स्पष्ट फिटेड मॉडल नहीं होता है, जो प्रशिक्षण को तुच्छ बनाता है लेकिन भविष्यवाणी को संभावित रूप से धीमा और मेमोरी-गहन बनाता है।