न्यूरल नेटवर्क आर्किटेक्चर
न्यूरल नेटवर्क आर्किटेक्चर यह निर्दिष्ट करते हैं कि कृत्रिम न्यूरॉन्स को परतों में कैसे जोड़ा जाता है, जो उन कार्यों के परिवार को परिभाषित करता है जिन्हें एक नेटवर्क दर्शा सकता है।
Definition
एक न्यूरल नेटवर्क आर्किटेक्चर कृत्रिम न्यूरॉन्स की जुड़ी हुई परतों में व्यवस्था है, जहाँ प्रत्येक न्यूरॉन अपने इनपुट के भारित योग का एक अरेखीय कार्य संगणित करता है; आर्किटेक्चर नेटवर्क की क्षमता और सीखने की समस्या में लाए गए आगमनात्मक पूर्वाग्रहों को निर्धारित करता है।
Scope
यह विषय न्यूरल नेटवर्क के मूलभूत घटकों और संरचनाओं को शामिल करता है: भारित इनपुट और एक अरेखीय सक्रियण के साथ कृत्रिम न्यूरॉन, पूरी तरह से जुड़े फीडफॉरवर्ड परतें और मल्टीलेयर परसेप्ट्रॉन, सिग्मॉइड और रेक्टिफाइड लीनियर यूनिट्स जैसे सक्रियण कार्य, और गहराई, चौड़ाई और कनेक्टिविटी एक नेटवर्क क्या सीख सकता है उसे कैसे आकार देते हैं। यह सार्वभौमिक सन्निकटन गुण और आर्किटेक्चर पसंद की भूमिका का परिचय देता है।
Core questions
- एक कृत्रिम न्यूरॉन अपना आउटपुट कैसे संगणित करता है?
- एक मल्टीलेयर नेटवर्क क्या दर्शा सकता है जो एक एकल परत नहीं कर सकती?
- सक्रियण कार्य सीखने को कैसे प्रभावित करते हैं?
- गहराई और चौड़ाई क्षमता और प्रशिक्षण क्षमता के बीच कैसे संतुलन बनाती हैं?
Key theories
- सार्वभौमिक सन्निकटन
- एक एकल पर्याप्त चौड़ी छिपी हुई परत वाला एक फीडफॉरवर्ड नेटवर्क एक परिबद्ध डोमेन पर किसी भी सतत कार्य का अनुमान लगा सकता है, जो न्यूरल नेटवर्क को लचीले कार्य सन्निकटनकर्ता के रूप में स्थापित करता है।
- सक्रियण कार्य और अरैखिकता
- अरेखीय सक्रियण ही मल्टीलेयर नेटवर्क को उनकी शक्ति प्रदान करते हैं; विशेष रूप से रेक्टिफाइड लीनियर यूनिट्स ग्रेडिएंट प्रवाह को आसान बनाते हैं और डीप नेटवर्क के लिए डिफ़ॉल्ट विकल्प बन गए हैं।
- संरचना के रूप में गहराई
- परतों को जोड़ने से परिवर्तन संयोजित होते हैं जिससे नेटवर्क तेजी से अमूर्त सुविधाएँ बनाता है, अक्सर एक एकल चौड़ी परत की तुलना में जटिल कार्यों को अधिक कुशलता से दर्शाता है।
Clinical relevance
आर्किटेक्चर का चुनाव मुख्य तरीका है जिससे किसी समस्या के बारे में पूर्व ज्ञान को एक डीप मॉडल में बनाया जाता है, सामान्य डेटा के लिए पूरी तरह से जुड़े नेटवर्क से लेकर छवियों और अनुक्रमों के लिए विशेष संरचनाओं तक; कृत्रिम न्यूरॉन और सार्वभौमिक सन्निकटन गुण को समझना न्यूरल नेटवर्क की शक्ति और सीमाओं दोनों को स्पष्ट करता है।
History
कृत्रिम न्यूरॉन का पता मैककुलोच और पिट्स और रोसेनब्लैट के परसेप्ट्रॉन से चलता है। मिंस्की और पैपर्ट की एकल-परत नेटवर्क की आलोचना ने इस क्षेत्र को तब तक धीमा कर दिया जब तक मल्टीलेयर नेटवर्क और बैकप्रॉपैगेशन ने इसे पुनर्जीवित नहीं किया, और डीप-लर्निंग युग ने रेक्टिफाइड-लीनियर यूनिट्स और अन्य घटकों से बनी दर्जनों या सैकड़ों परतों के आर्किटेक्चर लाए।
Key figures
- Frank Rosenblatt
- Geoffrey Hinton
- Yann LeCun
Related topics
Seminal works
- goodfellow2016
- bishop2006
- lecun2015
Frequently asked questions
- एक सक्रियण कार्य क्या है और इसकी आवश्यकता क्यों है?
- एक सक्रियण कार्य एक न्यूरॉन के भारित इनपुट योग पर एक अरेखीय परिवर्तन लागू करता है। इसके बिना, परतों को ढेर करने से केवल एक और रैखिक कार्य उत्पन्न होगा, इसलिए अरैखिकता ही डीप नेटवर्क को जटिल, अरेखीय संबंधों को दर्शाने देती है।
- यदि एक चौड़ी परत किसी भी कार्य का अनुमान लगा सकती है, तो गहरा क्यों जाएं?
- सार्वभौमिक सन्निकटन कहता है कि एक उथला नेटवर्क सिद्धांत रूप में किसी भी कार्य को फिट कर सकता है, लेकिन इसे अव्यावहारिक रूप से कई न्यूरॉन्स की आवश्यकता हो सकती है। डीप नेटवर्क अक्सर उन्हीं कार्यों को कहीं अधिक संक्षेप में दर्शाते हैं और उपयोगी पदानुक्रमित सुविधाएँ सीखते हैं, यही कारण है कि व्यवहार में गहराई को प्राथमिकता दी जाती है।