एक सक्रियण कार्य क्या है और इसकी आवश्यकता क्यों है?

एक सक्रियण कार्य एक न्यूरॉन के भारित इनपुट योग पर एक अरेखीय परिवर्तन लागू करता है। इसके बिना, परतों को ढेर करने से केवल एक और रैखिक कार्य उत्पन्न होगा, इसलिए अरैखिकता ही डीप नेटवर्क को जटिल, अरेखीय संबंधों को दर्शाने देती है।

यदि एक चौड़ी परत किसी भी कार्य का अनुमान लगा सकती है, तो गहरा क्यों जाएं?

सार्वभौमिक सन्निकटन कहता है कि एक उथला नेटवर्क सिद्धांत रूप में किसी भी कार्य को फिट कर सकता है, लेकिन इसे अव्यावहारिक रूप से कई न्यूरॉन्स की आवश्यकता हो सकती है। डीप नेटवर्क अक्सर उन्हीं कार्यों को कहीं अधिक संक्षेप में दर्शाते हैं और उपयोगी पदानुक्रमित सुविधाएँ सीखते हैं, यही कारण है कि व्यवहार में गहराई को प्राथमिकता दी जाती है।

न्यूरल नेटवर्क आर्किटेक्चर

न्यूरल नेटवर्क आर्किटेक्चर यह निर्दिष्ट करते हैं कि कृत्रिम न्यूरॉन्स को परतों में कैसे जोड़ा जाता है, जो उन कार्यों के परिवार को परिभाषित करता है जिन्हें एक नेटवर्क दर्शा सकता है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

एक न्यूरल नेटवर्क आर्किटेक्चर कृत्रिम न्यूरॉन्स की जुड़ी हुई परतों में व्यवस्था है, जहाँ प्रत्येक न्यूरॉन अपने इनपुट के भारित योग का एक अरेखीय कार्य संगणित करता है; आर्किटेक्चर नेटवर्क की क्षमता और सीखने की समस्या में लाए गए आगमनात्मक पूर्वाग्रहों को निर्धारित करता है।

Scope

यह विषय न्यूरल नेटवर्क के मूलभूत घटकों और संरचनाओं को शामिल करता है: भारित इनपुट और एक अरेखीय सक्रियण के साथ कृत्रिम न्यूरॉन, पूरी तरह से जुड़े फीडफॉरवर्ड परतें और मल्टीलेयर परसेप्ट्रॉन, सिग्मॉइड और रेक्टिफाइड लीनियर यूनिट्स जैसे सक्रियण कार्य, और गहराई, चौड़ाई और कनेक्टिविटी एक नेटवर्क क्या सीख सकता है उसे कैसे आकार देते हैं। यह सार्वभौमिक सन्निकटन गुण और आर्किटेक्चर पसंद की भूमिका का परिचय देता है।

Core questions

एक कृत्रिम न्यूरॉन अपना आउटपुट कैसे संगणित करता है?
एक मल्टीलेयर नेटवर्क क्या दर्शा सकता है जो एक एकल परत नहीं कर सकती?
सक्रियण कार्य सीखने को कैसे प्रभावित करते हैं?
गहराई और चौड़ाई क्षमता और प्रशिक्षण क्षमता के बीच कैसे संतुलन बनाती हैं?

Key theories

सार्वभौमिक सन्निकटन: एक एकल पर्याप्त चौड़ी छिपी हुई परत वाला एक फीडफॉरवर्ड नेटवर्क एक परिबद्ध डोमेन पर किसी भी सतत कार्य का अनुमान लगा सकता है, जो न्यूरल नेटवर्क को लचीले कार्य सन्निकटनकर्ता के रूप में स्थापित करता है।
सक्रियण कार्य और अरैखिकता: अरेखीय सक्रियण ही मल्टीलेयर नेटवर्क को उनकी शक्ति प्रदान करते हैं; विशेष रूप से रेक्टिफाइड लीनियर यूनिट्स ग्रेडिएंट प्रवाह को आसान बनाते हैं और डीप नेटवर्क के लिए डिफ़ॉल्ट विकल्प बन गए हैं।
संरचना के रूप में गहराई: परतों को जोड़ने से परिवर्तन संयोजित होते हैं जिससे नेटवर्क तेजी से अमूर्त सुविधाएँ बनाता है, अक्सर एक एकल चौड़ी परत की तुलना में जटिल कार्यों को अधिक कुशलता से दर्शाता है।

Clinical relevance

आर्किटेक्चर का चुनाव मुख्य तरीका है जिससे किसी समस्या के बारे में पूर्व ज्ञान को एक डीप मॉडल में बनाया जाता है, सामान्य डेटा के लिए पूरी तरह से जुड़े नेटवर्क से लेकर छवियों और अनुक्रमों के लिए विशेष संरचनाओं तक; कृत्रिम न्यूरॉन और सार्वभौमिक सन्निकटन गुण को समझना न्यूरल नेटवर्क की शक्ति और सीमाओं दोनों को स्पष्ट करता है।

History

कृत्रिम न्यूरॉन का पता मैककुलोच और पिट्स और रोसेनब्लैट के परसेप्ट्रॉन से चलता है। मिंस्की और पैपर्ट की एकल-परत नेटवर्क की आलोचना ने इस क्षेत्र को तब तक धीमा कर दिया जब तक मल्टीलेयर नेटवर्क और बैकप्रॉपैगेशन ने इसे पुनर्जीवित नहीं किया, और डीप-लर्निंग युग ने रेक्टिफाइड-लीनियर यूनिट्स और अन्य घटकों से बनी दर्जनों या सैकड़ों परतों के आर्किटेक्चर लाए।

Key figures

Frank Rosenblatt
Geoffrey Hinton
Yann LeCun

Seminal works

goodfellow2016
bishop2006
lecun2015

Frequently asked questions

एक सक्रियण कार्य क्या है और इसकी आवश्यकता क्यों है?: एक सक्रियण कार्य एक न्यूरॉन के भारित इनपुट योग पर एक अरेखीय परिवर्तन लागू करता है। इसके बिना, परतों को ढेर करने से केवल एक और रैखिक कार्य उत्पन्न होगा, इसलिए अरैखिकता ही डीप नेटवर्क को जटिल, अरेखीय संबंधों को दर्शाने देती है।
यदि एक चौड़ी परत किसी भी कार्य का अनुमान लगा सकती है, तो गहरा क्यों जाएं?: सार्वभौमिक सन्निकटन कहता है कि एक उथला नेटवर्क सिद्धांत रूप में किसी भी कार्य को फिट कर सकता है, लेकिन इसे अव्यावहारिक रूप से कई न्यूरॉन्स की आवश्यकता हो सकती है। डीप नेटवर्क अक्सर उन्हीं कार्यों को कहीं अधिक संक्षेप में दर्शाते हैं और उपयोगी पदानुक्रमित सुविधाएँ सीखते हैं, यही कारण है कि व्यवहार में गहराई को प्राथमिकता दी जाती है।