कनवोल्यूशनल नेटवर्क छवियों में इतने अच्छे क्यों होते हैं?

छवियों में स्थानीय संरचना और पैटर्न होते हैं जो कहीं भी दिखाई दे सकते हैं। कनवोल्यूशन पूरी छवि में एक ही फिल्टर लागू करता है, इसलिए एक किनारे जैसी सुविधा जहाँ भी होती है, उसका पता लगाया जाता है, एक पूरी तरह से जुड़े हुए परत की तुलना में बहुत कम पैरामीटर का उपयोग करके और बेहतर सामान्यीकरण करता है।

लॉन्ग शॉर्ट-टर्म मेमोरी किस समस्या का समाधान करती है?

सादे आवर्ती नेटवर्क कई समय चरणों में फैली निर्भरताओं को सीखने के लिए संघर्ष करते हैं क्योंकि ग्रेडिएंट गायब हो जाते हैं। लॉन्ग शॉर्ट-टर्म मेमोरी एक गेटेड मेमोरी सेल पेश करती है जो लंबे अंतराल पर जानकारी को संरक्षित करती है, जिससे लंबी दूरी के अस्थायी पैटर्न सीखना संभव हो जाता है।

कनवोल्यूशनल और अनुक्रम मॉडल

कनवोल्यूशनल नेटवर्क छवियों जैसे ग्रिड-जैसी डेटा में स्थानिक संरचना का उपयोग करते हैं, जबकि आवर्ती और ध्यान-आधारित मॉडल पाठ और भाषण जैसे अनुक्रमों को संसाधित करते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

कनवोल्यूशनल मॉडल एक ग्रिड में सीखे हुए फिल्टर लागू करते हैं ताकि हर स्थान पर एक ही फीचर डिटेक्टर का पुन: उपयोग किया जा सके, जबकि अनुक्रम मॉडल समय के साथ स्थिति बनाए रखकर या स्थितियों में भाग लेकर क्रमबद्ध इनपुट को संसाधित करते हैं, प्रत्येक आर्किटेक्चर अपने डेटा प्रकार के अनुकूल पूर्व धारणाओं को एन्कोड करता है।

Scope

यह विषय संरचित डेटा के लिए विशेषीकृत आर्किटेक्चर को शामिल करता है: छवियों और अन्य ग्रिडों के लिए स्थानीय फिल्टर, भार साझाकरण और पूलिंग के साथ कनवोल्यूशनल न्यूरल नेटवर्क; लंबी दूरी की निर्भरता वाले अनुक्रमों के लिए आवर्ती नेटवर्क और लॉन्ग शॉर्ट-टर्म मेमोरी इकाइयाँ; और ध्यान तंत्र जो स्थितियों के बीच संबंधों को मॉडल करते हैं। यह उन आगमनात्मक पूर्वाग्रहों को संबोधित करता है जो इन आर्किटेक्चर को प्रभावी बनाते हैं।

Core questions

कनवोल्यूशन छवियों में अनुवाद संरचना का उपयोग कैसे करता है?
भार साझाकरण और पूलिंग सामान्यीकरण और दक्षता में क्यों मदद करते हैं?
आवर्ती और लॉन्ग शॉर्ट-टर्म मेमोरी इकाइयाँ लंबी अनुक्रमों को कैसे संभालती हैं?
शुद्ध आवर्ती प्रसंस्करण पर ध्यान क्या जोड़ता है?

Key theories

कनवोल्यूशन और भार साझाकरण: कनवोल्यूशनल परतें सभी स्थितियों में एक ही छोटे फिल्टर को लागू करती हैं, जिससे पैरामीटर नाटकीय रूप से कम हो जाते हैं और अनुवाद समरूपता का निर्माण होता है ताकि एक स्थान पर सीखे गए फीचर्स हर जगह स्थानांतरित हो सकें।
लॉन्ग शॉर्ट-टर्म मेमोरी: लॉन्ग शॉर्ट-टर्म मेमोरी जैसी गेटेड आवर्ती इकाइयाँ एक संरक्षित मेमोरी सेल बनाए रखती हैं, जिससे आवर्ती नेटवर्क कई समय चरणों में निर्भरता सीख सकते हैं जो सादे आवर्ती नहीं कर सकते।
अनुक्रमों पर ध्यान: ध्यान तंत्र एक मॉडल को सीधे एक अनुक्रम की सभी स्थितियों से जानकारी का वजन और संयोजन करने देते हैं, लंबी दूरी के संबंधों को कैप्चर करते हैं और अत्यधिक समानांतर अनुक्रम प्रसंस्करण को सक्षम करते हैं।

Clinical relevance

कनवोल्यूशनल नेटवर्क ने कंप्यूटर विजन और मेडिकल इमेजिंग में क्रांति ला दी, जबकि अनुक्रम मॉडल ने भाषण पहचान और मशीन अनुवाद को शक्ति प्रदान की और, ध्यान के माध्यम से, आधुनिक प्राकृतिक भाषा प्रणालियों के पीछे बड़े भाषा मॉडल को; आर्किटेक्चर को डेटा संरचना से मिलाना अनुप्रयुक्त डीप लर्निंग में एक केंद्रीय डिजाइन सिद्धांत बना हुआ है।

History

कनवोल्यूशनल नेटवर्क फुकुशिमा के नियोकॉग्निट्रॉन और लेकुन के अंक पहचान पर काम से विकसित हुए, और बड़े पैमाने पर छवि वर्गीकरण पर उनकी 2012 की सफलता ने डीप-लर्निंग बूम को प्रज्वलित किया। 1997 में पेश की गई लॉन्ग शॉर्ट-टर्म मेमोरी ने अनुक्रमों के लिए लंबी दूरी की निर्भरता की समस्या को हल किया, और ध्यान तंत्र बाद में ट्रांसफार्मर मॉडल की नींव बन गए।

Key figures

Yann LeCun
Sepp Hochreiter
Juergen Schmidhuber
Kunihiko Fukushima

Seminal works

hochreiter1997
lecun2015
goodfellow2016

Frequently asked questions

कनवोल्यूशनल नेटवर्क छवियों में इतने अच्छे क्यों होते हैं?: छवियों में स्थानीय संरचना और पैटर्न होते हैं जो कहीं भी दिखाई दे सकते हैं। कनवोल्यूशन पूरी छवि में एक ही फिल्टर लागू करता है, इसलिए एक किनारे जैसी सुविधा जहाँ भी होती है, उसका पता लगाया जाता है, एक पूरी तरह से जुड़े हुए परत की तुलना में बहुत कम पैरामीटर का उपयोग करके और बेहतर सामान्यीकरण करता है।
लॉन्ग शॉर्ट-टर्म मेमोरी किस समस्या का समाधान करती है?: सादे आवर्ती नेटवर्क कई समय चरणों में फैली निर्भरताओं को सीखने के लिए संघर्ष करते हैं क्योंकि ग्रेडिएंट गायब हो जाते हैं। लॉन्ग शॉर्ट-टर्म मेमोरी एक गेटेड मेमोरी सेल पेश करती है जो लंबे अंतराल पर जानकारी को संरक्षित करती है, जिससे लंबी दूरी के अस्थायी पैटर्न सीखना संभव हो जाता है।