ScholarGate
सहायक

वर्गीकरण एल्गोरिदम

वर्गीकरण एल्गोरिदम लेबल किए गए उदाहरणों से निर्णय सीमाओं या वर्ग-संभाव्यता अनुमानों को सीखकर इनपुट को श्रेणियों के एक सीमित सेट में से एक को निर्दिष्ट करते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

एक वर्गीकरण एल्गोरिदम, इनपुट-लेबल युग्मों से, एक नियम सीखता है जो प्रत्येक नए इनपुट को एक असतत वर्ग में मैप करता है; जनरेटिव दृष्टिकोण प्रत्येक वर्ग के भीतर इनपुट के वितरण को मॉडल करते हैं और बेयस के नियम को लागू करते हैं, जबकि विभेदक दृष्टिकोण सीधे वर्ग सीमा या पश्च संभाव्यता को मॉडल करते हैं।

Scope

यह विषय श्रेणीबद्ध लेबलों की भविष्यवाणी के पर्यवेक्षित कार्य को शामिल करता है: संभाव्य जनरेटिव क्लासिफायर जैसे कि नैव बेयस और गाऊसी विभेदक विश्लेषण, विभेदक क्लासिफायर जैसे कि लॉजिस्टिक रिग्रेशन, इंस्टेंस-आधारित विधियाँ जैसे कि k-निकटतम पड़ोसी, और निर्णय सीमा, पश्च वर्ग संभाव्यता, और त्रुटि को कम करने वाले बेयस-इष्टतम क्लासिफायर की अवधारणाएँ।

Core questions

  • लेबल किए गए डेटा से वर्गों के बीच एक निर्णय सीमा का अनुमान कैसे लगाया जाता है?
  • एक क्लासिफायर को सीधे पश्च के बजाय वर्ग-सशर्त वितरण को कब मॉडल करना चाहिए?
  • बेयस-इष्टतम त्रुटि क्या है और एक सीखा हुआ क्लासिफायर इसके कितने करीब आ सकता है?
  • बहु-वर्ग समस्याओं को बाइनरी वर्गीकरण के साथ कैसे कम किया जाता है या हल किया जाता है?

Key theories

बेयस-इष्टतम वर्गीकरण
प्रत्येक इनपुट को उच्चतम पश्च संभाव्यता वाले वर्ग को निर्दिष्ट करना अपेक्षित गलत वर्गीकरण त्रुटि को कम करता है, जो सैद्धांतिक इष्टतम को परिभाषित करता है जिसे व्यावहारिक क्लासिफायर अनुमानित करते हैं।
जनरेटिव बनाम विभेदक मॉडल
नैव बेयस और विभेदक विश्लेषण मॉडल करते हैं कि प्रति वर्ग डेटा कैसे उत्पन्न होता है, जबकि लॉजिस्टिक रिग्रेशन सीधे वर्ग पश्च को मॉडल करता है, एक अंतर जो डेटा दक्षता और मॉडल मिसस्पेसिफिकेशन के प्रति मजबूती को प्रभावित करता है।
निकटतम-पड़ोसी वर्गीकरण
आस-पास के प्रशिक्षण बिंदुओं के लेबलों द्वारा वर्गीकरण एक सरल गैर-पैरामीट्रिक नियम है जिसकी त्रुटि बेयस त्रुटि के अधिकतम दोगुने से स्पर्शोन्मुख रूप से बंधी होती है, यह दर्शाता है कि कैसे केवल स्थानीय जानकारी शक्तिशाली हो सकती है।

Clinical relevance

वर्गीकरण अनुप्रयुक्त मशीन लर्निंग का मुख्य आधार है, जो ईमेल स्पैम डिटेक्शन, भावना विश्लेषण, छवि लेबलिंग, धोखाधड़ी का पता लगाने और कंप्यूटर-सहायता प्राप्त निदान के पीछे है; बेयस इष्टतम और जनरेटिव-विभेदक भेद को समझना विधि के चुनाव और वर्ग-संभाव्यता आउटपुट की व्याख्या का मार्गदर्शन करता है।

History

प्रारंभिक क्लासिफायर में फिशर का रैखिक विभेदक और कवर और हार्ट द्वारा 1967 में विश्लेषण किया गया निकटतम-पड़ोसी नियम शामिल थे। लॉजिस्टिक रिग्रेशन सांख्यिकी से मशीन लर्निंग में स्थानांतरित हो गया, और नैव बेयस और विभेदक विश्लेषण मानक संभाव्य बेसलाइन बन गए, जो सभी बाद में पश्च वर्ग संभाव्यताओं का अनुमान लगाने के ढांचे के भीतर एकीकृत हो गए।

Key figures

  • Thomas Cover
  • Peter Hart
  • Christopher Bishop

Related topics

Seminal works

  • cover1967
  • bishop2006
  • hastie2009

Frequently asked questions

क्या लॉजिस्टिक रिग्रेशन एक रिग्रेशन है या एक वर्गीकरण विधि है?
अपने नाम के बावजूद, लॉजिस्टिक रिग्रेशन का उपयोग वर्गीकरण के लिए किया जाता है। यह उस संभाव्यता को मॉडल करता है कि एक इनपुट एक वर्ग से संबंधित है, और एक निर्णय नियम फिर उस संभाव्यता को एक अनुमानित लेबल में परिवर्तित करता है।
k-निकटतम पड़ोसियों को प्रशिक्षण चरण की आवश्यकता क्यों नहीं होती है?
k-निकटतम पड़ोसी प्रशिक्षण डेटा को संग्रहीत करता है और भविष्यवाणी के समय अपने निकटतम संग्रहीत उदाहरणों को देखकर एक नए बिंदु को वर्गीकृत करता है। कोई स्पष्ट फिटेड मॉडल नहीं होता है, जो प्रशिक्षण को तुच्छ बनाता है लेकिन भविष्यवाणी को संभावित रूप से धीमा और मेमोरी-गहन बनाता है।

Methods for this concept

Related concepts