अनसुपरवाइज्ड लर्निंग (Unsupervised Learning)
अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) बिना लेबल वाले डेटा में संरचना की खोज करती है, जिसमें लक्ष्य आउटपुट (target outputs) की नकल किए बिना समूहन, निम्न-आयामी प्रतिनिधित्व और अव्यक्त कारकों (latent factors) का पता लगाया जाता है।
Definition
अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) केवल इनपुट से संरचना का अनुमान है, जिसमें कोई संबद्ध लक्ष्य मान (target values) नहीं होते हैं; एल्गोरिदम डेटा के संक्षिप्त विवरण जैसे क्लस्टर असाइनमेंट (cluster assignments), निम्न-आयामी निर्देशांक (low-dimensional coordinates), या जनरेटिव अव्यक्त चर (generative latent variables) की तलाश करते हैं जो यह बताते हैं कि प्रेक्षित डेटा (observed data) कैसे उत्पन्न हुआ होगा।
Scope
यह क्षेत्र बिना लेबल वाले डेटा से सीखने को कवर करता है: समूहों में क्लस्टरिंग (clustering), आयामी कमी (dimensionality reduction) और मैनिफोल्ड लर्निंग (manifold learning), एक्सपेक्टेशन-मैक्सिमाइजेशन एल्गोरिथम (expectation-maximization algorithm) द्वारा फिट किए गए अव्यक्त-परिवर्तनीय (latent-variable) और मिश्रण मॉडल (mixture models), घनत्व अनुमान (density estimation), और आधुनिक सेल्फ-सुपरवाइज्ड (self-supervised) और रिप्रेजेंटेशन लर्निंग (representation learning) जो डेटा से ही प्रशिक्षण संकेत (training signals) उत्पन्न करती है।
Sub-topics
Core questions
- बिना किसी लेबल के डेटा से क्या संरचना प्राप्त की जा सकती है?
- प्राकृतिक समूहन या क्लस्टर (clusters) को कैसे परिभाषित और खोजा जाता है?
- उच्च-आयामी डेटा को कुछ निर्देशांकों द्वारा कैसे संक्षेपित किया जा सकता है?
- अव्यक्त-परिवर्तनीय मॉडल (latent-variable models) छिपे हुए कारणों के माध्यम से अवलोकनों की व्याख्या कैसे करते हैं?
Key theories
- अव्यक्त-परिवर्तनीय मॉडल (Latent-variable models) और EM
- कई अनसुपरवाइज्ड मॉडल (unsupervised models) छिपे हुए चर (hidden variables) को मानते हैं जो डेटा उत्पन्न करते हैं, और एक्सपेक्टेशन-मैक्सिमाइजेशन एल्गोरिथम (expectation-maximization algorithm) अव्यक्त चर (latent variables) का अनुमान लगाने और संभावना बढ़ाने के लिए मापदंडों (parameters) को अपडेट करने के बीच बारी-बारी से उन्हें फिट करता है।
- आयामी कमी (Dimensionality reduction)
- प्रिंसिपल कंपोनेंट एनालिसिस (principal component analysis) और मैनिफोल्ड लर्निंग (manifold learning) जैसी विधियाँ निम्न-आयामी प्रतिनिधित्व (low-dimensional representations) पाती हैं जो सबसे महत्वपूर्ण भिन्नता को संरक्षित करती हैं, जिससे विज़ुअलाइज़ेशन (visualization), संपीड़न (compression) और शोर में कमी (noise reduction) संभव होती है।
- क्लस्टरिंग संरचना (Clustering structure)
- क्लस्टरिंग (Clustering) डेटा को समान वस्तुओं के समूहों में विभाजित करती है, जिसे क्लस्टर के भीतर की दूरी (within-cluster distance), संभाव्य मिश्रण (probabilistic mixtures), या घनत्व (density) के माध्यम से विभिन्न रूप से औपचारिक रूप दिया जाता है, जिसमें क्लस्टर की सही संख्या या आकार की कोई एक परिभाषा नहीं होती है।
Clinical relevance
अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) उन जगहों पर आवश्यक है जहाँ लेबल दुर्लभ या अनुपस्थित हैं, ग्राहक विभाजन (customer segmentation), विसंगति का पता लगाने (anomaly detection), अन्वेषी डेटा विश्लेषण (exploratory data analysis), और प्रतिनिधित्व के प्रीट्रेनिंग (pretraining) का समर्थन करती है जो आधुनिक सुपरवाइज्ड (supervised) और भाषा प्रणालियों को शक्ति प्रदान करते हैं; क्योंकि कोई ग्राउंड-ट्रुथ लक्ष्य (ground-truth target) नहीं है, अनसुपरवाइज्ड परिणामों का मूल्यांकन करना अपने आप में एक सूक्ष्म और महत्वपूर्ण समस्या है।
History
अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) की जड़ें सांख्यिकी से क्लस्टरिंग (clustering) और फैक्टर एनालिसिस (factor analysis) और सेल्फ-ऑर्गनाइजिंग न्यूरल नेटवर्क (self-organizing neural networks) में हैं। 1977 में औपचारिक रूप से प्रस्तुत एक्सपेक्टेशन-मैक्सिमाइजेशन एल्गोरिथम (expectation-maximization algorithm) ने अव्यक्त-परिवर्तनीय मॉडल (latent-variable models) के फिटिंग को एकीकृत किया, और हाल के वर्षों में सेल्फ-सुपरवाइज्ड रिप्रेजेंटेशन लर्निंग (self-supervised representation learning) बिना लेबल वाले डेटा पर बड़े मॉडल को प्रीट्रेनिंग (pretraining) के लिए एक प्रमुख प्रतिमान बन गया है।
Debates
- अनसुपरवाइज्ड परिणामों का मूल्यांकन कैसे करें
- लेबल के बिना कोई एक सही उत्तर नहीं होता है, इसलिए क्लस्टरिंग (clusterings) या सीखे गए प्रतिनिधित्व (learned representations) का मूल्यांकन अप्रत्यक्ष मानदंडों, डाउनस्ट्रीम कार्य प्रदर्शन (downstream task performance), या मानवीय व्याख्या पर निर्भर करता है, और विभिन्न वैधता माप (validity measures) असहमत हो सकते हैं।
Key figures
- Arthur Dempster
- Donald Rubin
- Geoffrey Hinton
- Christopher Bishop
Related topics
Seminal works
- bishop2006
- hastie2009
- dempster1977
Frequently asked questions
- एक मॉडल बिना लेबल के कुछ भी कैसे सीख सकता है?
- अनसुपरवाइज्ड विधियाँ डेटा में पहले से मौजूद संरचना का फायदा उठाती हैं, जैसे कि कौन से बिंदु एक-दूसरे के करीब हैं, कौन सी दिशाएँ सबसे अधिक भिन्नता रखती हैं, या कौन से अव्यक्त कारक (latent factors) अवलोकनों को उत्पन्न कर सकते थे। डेटा की अपनी नियमितताएँ संकेत प्रदान करती हैं।
- अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) का मूल्यांकन करना कठिन क्यों है?
- तुलना करने के लिए कोई ग्राउंड-ट्रुथ लक्ष्य (ground-truth target) नहीं है, इसलिए सफलता का मूल्यांकन अप्रत्यक्ष रूप से किया जाता है, उदाहरण के लिए क्लस्टर कितने व्याख्या योग्य हैं या एक सीखा हुआ प्रतिनिधित्व (learned representation) बाद के सुपरवाइज्ड कार्य (supervised task) में कितनी अच्छी तरह मदद करता है। विभिन्न मानदंड एक ही परिणाम को अलग-अलग रैंक कर सकते हैं।