क्या लॉजिस्टिक रिग्रेशन एक रिग्रेशन है या एक वर्गीकरण विधि है?

अपने नाम के बावजूद, लॉजिस्टिक रिग्रेशन का उपयोग वर्गीकरण के लिए किया जाता है। यह उस संभाव्यता को मॉडल करता है कि एक इनपुट एक वर्ग से संबंधित है, और एक निर्णय नियम फिर उस संभाव्यता को एक अनुमानित लेबल में परिवर्तित करता है।

k-निकटतम पड़ोसियों को प्रशिक्षण चरण की आवश्यकता क्यों नहीं होती है?

k-निकटतम पड़ोसी प्रशिक्षण डेटा को संग्रहीत करता है और भविष्यवाणी के समय अपने निकटतम संग्रहीत उदाहरणों को देखकर एक नए बिंदु को वर्गीकृत करता है। कोई स्पष्ट फिटेड मॉडल नहीं होता है, जो प्रशिक्षण को तुच्छ बनाता है लेकिन भविष्यवाणी को संभावित रूप से धीमा और मेमोरी-गहन बनाता है।

वर्गीकरण एल्गोरिदम

वर्गीकरण एल्गोरिदम लेबल किए गए उदाहरणों से निर्णय सीमाओं या वर्ग-संभाव्यता अनुमानों को सीखकर इनपुट को श्रेणियों के एक सीमित सेट में से एक को निर्दिष्ट करते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

एक वर्गीकरण एल्गोरिदम, इनपुट-लेबल युग्मों से, एक नियम सीखता है जो प्रत्येक नए इनपुट को एक असतत वर्ग में मैप करता है; जनरेटिव दृष्टिकोण प्रत्येक वर्ग के भीतर इनपुट के वितरण को मॉडल करते हैं और बेयस के नियम को लागू करते हैं, जबकि विभेदक दृष्टिकोण सीधे वर्ग सीमा या पश्च संभाव्यता को मॉडल करते हैं।

Scope

यह विषय श्रेणीबद्ध लेबलों की भविष्यवाणी के पर्यवेक्षित कार्य को शामिल करता है: संभाव्य जनरेटिव क्लासिफायर जैसे कि नैव बेयस और गाऊसी विभेदक विश्लेषण, विभेदक क्लासिफायर जैसे कि लॉजिस्टिक रिग्रेशन, इंस्टेंस-आधारित विधियाँ जैसे कि k-निकटतम पड़ोसी, और निर्णय सीमा, पश्च वर्ग संभाव्यता, और त्रुटि को कम करने वाले बेयस-इष्टतम क्लासिफायर की अवधारणाएँ।

Core questions

लेबल किए गए डेटा से वर्गों के बीच एक निर्णय सीमा का अनुमान कैसे लगाया जाता है?
एक क्लासिफायर को सीधे पश्च के बजाय वर्ग-सशर्त वितरण को कब मॉडल करना चाहिए?
बेयस-इष्टतम त्रुटि क्या है और एक सीखा हुआ क्लासिफायर इसके कितने करीब आ सकता है?
बहु-वर्ग समस्याओं को बाइनरी वर्गीकरण के साथ कैसे कम किया जाता है या हल किया जाता है?

Key theories

बेयस-इष्टतम वर्गीकरण: प्रत्येक इनपुट को उच्चतम पश्च संभाव्यता वाले वर्ग को निर्दिष्ट करना अपेक्षित गलत वर्गीकरण त्रुटि को कम करता है, जो सैद्धांतिक इष्टतम को परिभाषित करता है जिसे व्यावहारिक क्लासिफायर अनुमानित करते हैं।
जनरेटिव बनाम विभेदक मॉडल: नैव बेयस और विभेदक विश्लेषण मॉडल करते हैं कि प्रति वर्ग डेटा कैसे उत्पन्न होता है, जबकि लॉजिस्टिक रिग्रेशन सीधे वर्ग पश्च को मॉडल करता है, एक अंतर जो डेटा दक्षता और मॉडल मिसस्पेसिफिकेशन के प्रति मजबूती को प्रभावित करता है।
निकटतम-पड़ोसी वर्गीकरण: आस-पास के प्रशिक्षण बिंदुओं के लेबलों द्वारा वर्गीकरण एक सरल गैर-पैरामीट्रिक नियम है जिसकी त्रुटि बेयस त्रुटि के अधिकतम दोगुने से स्पर्शोन्मुख रूप से बंधी होती है, यह दर्शाता है कि कैसे केवल स्थानीय जानकारी शक्तिशाली हो सकती है।

Clinical relevance

वर्गीकरण अनुप्रयुक्त मशीन लर्निंग का मुख्य आधार है, जो ईमेल स्पैम डिटेक्शन, भावना विश्लेषण, छवि लेबलिंग, धोखाधड़ी का पता लगाने और कंप्यूटर-सहायता प्राप्त निदान के पीछे है; बेयस इष्टतम और जनरेटिव-विभेदक भेद को समझना विधि के चुनाव और वर्ग-संभाव्यता आउटपुट की व्याख्या का मार्गदर्शन करता है।

History

प्रारंभिक क्लासिफायर में फिशर का रैखिक विभेदक और कवर और हार्ट द्वारा 1967 में विश्लेषण किया गया निकटतम-पड़ोसी नियम शामिल थे। लॉजिस्टिक रिग्रेशन सांख्यिकी से मशीन लर्निंग में स्थानांतरित हो गया, और नैव बेयस और विभेदक विश्लेषण मानक संभाव्य बेसलाइन बन गए, जो सभी बाद में पश्च वर्ग संभाव्यताओं का अनुमान लगाने के ढांचे के भीतर एकीकृत हो गए।

Key figures

Thomas Cover
Peter Hart
Christopher Bishop

Seminal works

cover1967
bishop2006
hastie2009

Frequently asked questions

क्या लॉजिस्टिक रिग्रेशन एक रिग्रेशन है या एक वर्गीकरण विधि है?: अपने नाम के बावजूद, लॉजिस्टिक रिग्रेशन का उपयोग वर्गीकरण के लिए किया जाता है। यह उस संभाव्यता को मॉडल करता है कि एक इनपुट एक वर्ग से संबंधित है, और एक निर्णय नियम फिर उस संभाव्यता को एक अनुमानित लेबल में परिवर्तित करता है।
k-निकटतम पड़ोसियों को प्रशिक्षण चरण की आवश्यकता क्यों नहीं होती है?: k-निकटतम पड़ोसी प्रशिक्षण डेटा को संग्रहीत करता है और भविष्यवाणी के समय अपने निकटतम संग्रहीत उदाहरणों को देखकर एक नए बिंदु को वर्गीकृत करता है। कोई स्पष्ट फिटेड मॉडल नहीं होता है, जो प्रशिक्षण को तुच्छ बनाता है लेकिन भविष्यवाणी को संभावित रूप से धीमा और मेमोरी-गहन बनाता है।