ओवरफिटिंग और अंडरफिटिंग में क्या अंतर है?

अंडरफिटिंग तब होती है जब एक मॉडल अंतर्निहित पैटर्न को पकड़ने के लिए बहुत सरल होता है, जिससे उच्च बायस और प्रशिक्षण डेटा पर भी खराब प्रदर्शन होता है। ओवरफिटिंग तब होती है जब एक मॉडल इतना लचीला होता है कि वह प्रशिक्षण डेटा में शोर को फिट कर लेता है, जिससे उच्च वेरिएंस और नए डेटा पर खराब प्रदर्शन होता है।

नियमितीकरण कैसे मदद करता है?

नियमितीकरण मॉडल की जटिलता पर एक दंड जोड़ता है, अत्यधिक या कई मापदंडों को हतोत्साहित करता है। यह वेरिएंस को कम करता है, आमतौर पर बायस में थोड़ी वृद्धि की कीमत पर, और इस प्रकार अनदेखे डेटा पर कुल त्रुटि को कम करता है जब जटिलता अन्यथा बहुत अधिक होगी।

बायस-वेरिएंस और ओवरफिटिंग

बायस-वेरिएंस ट्रेड-ऑफ बताता है कि मॉडल की जटिलता पूर्वानुमान त्रुटि को कैसे नियंत्रित करती है, जिसमें ओवरफिटिंग और अंडरफिटिंग दो विफलता मोड हैं जिन्हें एक सीखने वाले को संतुलित करना चाहिए।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

बायस-वेरिएंस ट्रेड-ऑफ वह सिद्धांत है कि अपेक्षित पूर्वानुमान त्रुटि बायस में विघटित हो जाती है, जो सत्य को पकड़ने के लिए बहुत सरल मॉडल से त्रुटि है, और वेरिएंस, जो विशेष प्रशिक्षण नमूने के प्रति बहुत संवेदनशील मॉडल से त्रुटि है, जिसमें मॉडल की जटिलता दोनों के बीच त्रुटि को स्थानांतरित करती है।

Scope

यह विषय अपेक्षित पूर्वानुमान त्रुटि का बायस, वेरिएंस और अपरिवर्तनीय शोर में अपघटन; ओवरफिटिंग और अंडरफिटिंग का अर्थ; और संतुलन को बदलने में नियमितीकरण की भूमिका को शामिल करता है। इसमें शास्त्रीय U-आकार का त्रुटि वक्र और अत्यधिक ओवरपैरामीटराइज़्ड मॉडलों में डबल डिसेंट के हालिया अवलोकन भी शामिल हैं।

Core questions

अपेक्षित त्रुटि बायस, वेरिएंस और शोर में कैसे विघटित होती है?
ओवरफिटिंग बनाम अंडरफिटिंग की क्या विशेषताएँ हैं?
नियमितीकरण बायस-वेरिएंस संतुलन को कैसे बदलता है?
बहुत लचीले मॉडल कभी-कभी उच्च क्षमता के बावजूद सामान्यीकरण क्यों कर सकते हैं?

Key theories

बायस-वेरिएंस अपघटन: वर्ग-त्रुटि हानि के लिए, अपेक्षित त्रुटि वर्ग बायस, वेरिएंस और अपरिवर्तनीय शोर में विभाजित हो जाती है, यह स्पष्ट करती है कि सरलीकरण धारणाएँ बायस की कीमत पर वेरिएंस को कैसे कम करती हैं और इसके विपरीत।
ओवरफिटिंग और नियमितीकरण: ओवरफिटिंग तब होती है जब एक मॉडल सिग्नल के बजाय शोर को पकड़ता है; नियमितीकरण जटिलता को दंडित करता है ताकि वेरिएंस को कम किया जा सके, बायस में थोड़ी वृद्धि के बदले वेरिएंस में बड़ी कमी का व्यापार करता है।
शास्त्रीय ट्रेड-ऑफ से परे: बहुत अधिक पैरामीटराइज़्ड व्यवस्थाओं में त्रुटि इंटरपोलेशन बिंदु से आगे फिर से घट सकती है, जिसे डबल-डिसेंट घटना कहते हैं, जो एकल U-आकार के वक्र की शास्त्रीय तस्वीर को जटिल बनाती है।

Clinical relevance

बायस-वेरिएंस ट्रेड-ऑफ मॉडल फिटिंग का व्यावहारिक केंद्र है, जो नए डेटा पर त्रुटि को कम करने के लिए मॉडल आकार, नियमितीकरण शक्ति और फीचर गणना के विकल्पों का मार्गदर्शन करता है; यह निदान करना कि क्या कोई मॉडल अंडरफिटिंग या ओवरफिटिंग कर रहा है, अनुप्रयुक्त मशीन लर्निंग में एक नियमित और आवश्यक कदम है।

History

बायस-वेरिएंस अपघटन को 1992 के आसपास गेमन और उनके सहयोगियों द्वारा तंत्रिका नेटवर्क और सीखने के लिए स्पष्ट किया गया था और यह सांख्यिकी और मशीन लर्निंग में एक मानक लेंस बन गया। नियमितीकरण सिद्धांत ने जटिलता नियंत्रण को औपचारिक रूप दिया, और हाल के डबल-डिसेंट निष्कर्षों ने आधुनिक ओवरपैरामीटराइज़्ड मॉडलों के लिए ट्रेड-ऑफ की फिर से जांच को प्रेरित किया है।

Key figures

Stuart Geman
Trevor Hastie
Christopher Bishop

Seminal works

hastie2009
bishop2006
geman1992

Frequently asked questions

ओवरफिटिंग और अंडरफिटिंग में क्या अंतर है?: अंडरफिटिंग तब होती है जब एक मॉडल अंतर्निहित पैटर्न को पकड़ने के लिए बहुत सरल होता है, जिससे उच्च बायस और प्रशिक्षण डेटा पर भी खराब प्रदर्शन होता है। ओवरफिटिंग तब होती है जब एक मॉडल इतना लचीला होता है कि वह प्रशिक्षण डेटा में शोर को फिट कर लेता है, जिससे उच्च वेरिएंस और नए डेटा पर खराब प्रदर्शन होता है।
नियमितीकरण कैसे मदद करता है?: नियमितीकरण मॉडल की जटिलता पर एक दंड जोड़ता है, अत्यधिक या कई मापदंडों को हतोत्साहित करता है। यह वेरिएंस को कम करता है, आमतौर पर बायस में थोड़ी वृद्धि की कीमत पर, और इस प्रकार अनदेखे डेटा पर कुल त्रुटि को कम करता है जब जटिलता अन्यथा बहुत अधिक होगी।