एक मॉडल बिना लेबल के कुछ भी कैसे सीख सकता है?

अनसुपरवाइज्ड विधियाँ डेटा में पहले से मौजूद संरचना का फायदा उठाती हैं, जैसे कि कौन से बिंदु एक-दूसरे के करीब हैं, कौन सी दिशाएँ सबसे अधिक भिन्नता रखती हैं, या कौन से अव्यक्त कारक (latent factors) अवलोकनों को उत्पन्न कर सकते थे। डेटा की अपनी नियमितताएँ संकेत प्रदान करती हैं।

अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) का मूल्यांकन करना कठिन क्यों है?

तुलना करने के लिए कोई ग्राउंड-ट्रुथ लक्ष्य (ground-truth target) नहीं है, इसलिए सफलता का मूल्यांकन अप्रत्यक्ष रूप से किया जाता है, उदाहरण के लिए क्लस्टर कितने व्याख्या योग्य हैं या एक सीखा हुआ प्रतिनिधित्व (learned representation) बाद के सुपरवाइज्ड कार्य (supervised task) में कितनी अच्छी तरह मदद करता है। विभिन्न मानदंड एक ही परिणाम को अलग-अलग रैंक कर सकते हैं।

अनसुपरवाइज्ड लर्निंग (Unsupervised Learning)

अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) बिना लेबल वाले डेटा में संरचना की खोज करती है, जिसमें लक्ष्य आउटपुट (target outputs) की नकल किए बिना समूहन, निम्न-आयामी प्रतिनिधित्व और अव्यक्त कारकों (latent factors) का पता लगाया जाता है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) केवल इनपुट से संरचना का अनुमान है, जिसमें कोई संबद्ध लक्ष्य मान (target values) नहीं होते हैं; एल्गोरिदम डेटा के संक्षिप्त विवरण जैसे क्लस्टर असाइनमेंट (cluster assignments), निम्न-आयामी निर्देशांक (low-dimensional coordinates), या जनरेटिव अव्यक्त चर (generative latent variables) की तलाश करते हैं जो यह बताते हैं कि प्रेक्षित डेटा (observed data) कैसे उत्पन्न हुआ होगा।

Scope

यह क्षेत्र बिना लेबल वाले डेटा से सीखने को कवर करता है: समूहों में क्लस्टरिंग (clustering), आयामी कमी (dimensionality reduction) और मैनिफोल्ड लर्निंग (manifold learning), एक्सपेक्टेशन-मैक्सिमाइजेशन एल्गोरिथम (expectation-maximization algorithm) द्वारा फिट किए गए अव्यक्त-परिवर्तनीय (latent-variable) और मिश्रण मॉडल (mixture models), घनत्व अनुमान (density estimation), और आधुनिक सेल्फ-सुपरवाइज्ड (self-supervised) और रिप्रेजेंटेशन लर्निंग (representation learning) जो डेटा से ही प्रशिक्षण संकेत (training signals) उत्पन्न करती है।

Sub-topics

Core questions

बिना किसी लेबल के डेटा से क्या संरचना प्राप्त की जा सकती है?
प्राकृतिक समूहन या क्लस्टर (clusters) को कैसे परिभाषित और खोजा जाता है?
उच्च-आयामी डेटा को कुछ निर्देशांकों द्वारा कैसे संक्षेपित किया जा सकता है?
अव्यक्त-परिवर्तनीय मॉडल (latent-variable models) छिपे हुए कारणों के माध्यम से अवलोकनों की व्याख्या कैसे करते हैं?

Key theories

अव्यक्त-परिवर्तनीय मॉडल (Latent-variable models) और EM: कई अनसुपरवाइज्ड मॉडल (unsupervised models) छिपे हुए चर (hidden variables) को मानते हैं जो डेटा उत्पन्न करते हैं, और एक्सपेक्टेशन-मैक्सिमाइजेशन एल्गोरिथम (expectation-maximization algorithm) अव्यक्त चर (latent variables) का अनुमान लगाने और संभावना बढ़ाने के लिए मापदंडों (parameters) को अपडेट करने के बीच बारी-बारी से उन्हें फिट करता है।
आयामी कमी (Dimensionality reduction): प्रिंसिपल कंपोनेंट एनालिसिस (principal component analysis) और मैनिफोल्ड लर्निंग (manifold learning) जैसी विधियाँ निम्न-आयामी प्रतिनिधित्व (low-dimensional representations) पाती हैं जो सबसे महत्वपूर्ण भिन्नता को संरक्षित करती हैं, जिससे विज़ुअलाइज़ेशन (visualization), संपीड़न (compression) और शोर में कमी (noise reduction) संभव होती है।
क्लस्टरिंग संरचना (Clustering structure): क्लस्टरिंग (Clustering) डेटा को समान वस्तुओं के समूहों में विभाजित करती है, जिसे क्लस्टर के भीतर की दूरी (within-cluster distance), संभाव्य मिश्रण (probabilistic mixtures), या घनत्व (density) के माध्यम से विभिन्न रूप से औपचारिक रूप दिया जाता है, जिसमें क्लस्टर की सही संख्या या आकार की कोई एक परिभाषा नहीं होती है।

Clinical relevance

अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) उन जगहों पर आवश्यक है जहाँ लेबल दुर्लभ या अनुपस्थित हैं, ग्राहक विभाजन (customer segmentation), विसंगति का पता लगाने (anomaly detection), अन्वेषी डेटा विश्लेषण (exploratory data analysis), और प्रतिनिधित्व के प्रीट्रेनिंग (pretraining) का समर्थन करती है जो आधुनिक सुपरवाइज्ड (supervised) और भाषा प्रणालियों को शक्ति प्रदान करते हैं; क्योंकि कोई ग्राउंड-ट्रुथ लक्ष्य (ground-truth target) नहीं है, अनसुपरवाइज्ड परिणामों का मूल्यांकन करना अपने आप में एक सूक्ष्म और महत्वपूर्ण समस्या है।

History

अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) की जड़ें सांख्यिकी से क्लस्टरिंग (clustering) और फैक्टर एनालिसिस (factor analysis) और सेल्फ-ऑर्गनाइजिंग न्यूरल नेटवर्क (self-organizing neural networks) में हैं। 1977 में औपचारिक रूप से प्रस्तुत एक्सपेक्टेशन-मैक्सिमाइजेशन एल्गोरिथम (expectation-maximization algorithm) ने अव्यक्त-परिवर्तनीय मॉडल (latent-variable models) के फिटिंग को एकीकृत किया, और हाल के वर्षों में सेल्फ-सुपरवाइज्ड रिप्रेजेंटेशन लर्निंग (self-supervised representation learning) बिना लेबल वाले डेटा पर बड़े मॉडल को प्रीट्रेनिंग (pretraining) के लिए एक प्रमुख प्रतिमान बन गया है।

Debates

अनसुपरवाइज्ड परिणामों का मूल्यांकन कैसे करें: लेबल के बिना कोई एक सही उत्तर नहीं होता है, इसलिए क्लस्टरिंग (clusterings) या सीखे गए प्रतिनिधित्व (learned representations) का मूल्यांकन अप्रत्यक्ष मानदंडों, डाउनस्ट्रीम कार्य प्रदर्शन (downstream task performance), या मानवीय व्याख्या पर निर्भर करता है, और विभिन्न वैधता माप (validity measures) असहमत हो सकते हैं।

Key figures

Arthur Dempster
Donald Rubin
Geoffrey Hinton
Christopher Bishop

Seminal works

bishop2006
hastie2009
dempster1977

Frequently asked questions

एक मॉडल बिना लेबल के कुछ भी कैसे सीख सकता है?: अनसुपरवाइज्ड विधियाँ डेटा में पहले से मौजूद संरचना का फायदा उठाती हैं, जैसे कि कौन से बिंदु एक-दूसरे के करीब हैं, कौन सी दिशाएँ सबसे अधिक भिन्नता रखती हैं, या कौन से अव्यक्त कारक (latent factors) अवलोकनों को उत्पन्न कर सकते थे। डेटा की अपनी नियमितताएँ संकेत प्रदान करती हैं।
अनसुपरवाइज्ड लर्निंग (Unsupervised Learning) का मूल्यांकन करना कठिन क्यों है?: तुलना करने के लिए कोई ग्राउंड-ट्रुथ लक्ष्य (ground-truth target) नहीं है, इसलिए सफलता का मूल्यांकन अप्रत्यक्ष रूप से किया जाता है, उदाहरण के लिए क्लस्टर कितने व्याख्या योग्य हैं या एक सीखा हुआ प्रतिनिधित्व (learned representation) बाद के सुपरवाइज्ड कार्य (supervised task) में कितनी अच्छी तरह मदद करता है। विभिन्न मानदंड एक ही परिणाम को अलग-अलग रैंक कर सकते हैं।