पुरस्कार भविष्यवाणी त्रुटि क्या है?

यह उस पुरस्कार के बीच का अंतर है जो एक परिणाम प्रदान करता है और वह पुरस्कार जो अपेक्षित था। मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स इस अंतर का संकेत देते हैं, अपेक्षित से बेहतर परिणामों के लिए अधिक फायरिंग करते हैं और अपेक्षित से बदतर परिणामों के लिए कम फायरिंग करते हैं, जो एक सीखने का संकेत प्रदान करता है जो भविष्य की अपेक्षाओं को अद्यतन करता है।

क्या डोपामाइन मस्तिष्क का 'खुशी रसायन' है?

यह लोकप्रिय विवरण भ्रामक है। बहुत से साक्ष्य इंगित करते हैं कि फेसिक डोपामाइन संकेत मुख्य रूप से सीखने और पुरस्कार की भविष्यवाणी से संबंधित हैं, न कि खुशी के अनुभव से, जिसमें अन्य प्रणालियाँ शामिल प्रतीत होती हैं।

पुरस्कार और निर्णय-निर्माण

पुरस्कार प्रसंस्करण और मूल्य-आधारित निर्णय-निर्माण इस बात से संबंधित हैं कि मस्तिष्क परिणामों के मूल्य का प्रतिनिधित्व कैसे करता है, कार्यों के परिणामों से कैसे सीखता है, और विकल्पों में से कैसे चुनता है। मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स अपेक्षित और प्राप्त पुरस्कार के बीच विसंगतियों का संकेत देते हैं, और स्ट्रिएटम, ऑर्बिटोफ्रंटल और वेंट्रोमेडियल प्रीफ्रंटल कॉर्टेक्स सहित एक नेटवर्क व्यवहार को निर्देशित करने के लिए विकल्पों के मूल्य की गणना और तुलना करता है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

पुरस्कार और निर्णय-निर्माण इस बात का अध्ययन है कि मस्तिष्क परिणामों को कैसे महत्व देता है, भविष्यवाणी त्रुटियों से सीखने के माध्यम से अपेक्षाओं को अद्यतन करता है, और प्रतिस्पर्धी कार्यों में से चयन करने के लिए इन मूल्य अभ्यावेदन का उपयोग कैसे करता है।

Scope

यह विषय संज्ञानात्मक तंत्रिका विज्ञान में संदर्भ सामग्री के रूप में पुरस्कार और मूल्य-आधारित निर्णय-निर्माण के तंत्रिका विज्ञान को शामिल करता है। यह पुरस्कार भविष्यवाणी-त्रुटि संकेत, मस्तिष्क की मूल्यांकन प्रणालियों, सुदृढीकरण-शिक्षण ढाँचों, और प्रेरणा तथा पुरस्कार के विकारों के लिए इन परिपथों की प्रासंगिकता का परिचय देता है। यह तंत्र और साक्ष्य की व्याख्या करता है और नैदानिक मार्गदर्शन नहीं है।

Core questions

मस्तिष्क विभिन्न परिणामों और विकल्पों के मूल्य का प्रतिनिधित्व कैसे करता है?
डोपामाइन संकेत और सुदृढीकरण-शिक्षण तंत्र मस्तिष्क को पुरस्कार और दंड से सीखने की अनुमति कैसे देते हैं?
निर्णय-निर्माण के दौरान कौन से क्षेत्र मूल्य की गणना, तुलना और उस पर कार्य करते हैं?

Key concepts

पुरस्कार भविष्यवाणी त्रुटि
फेसिक डोपामाइन संकेत
सुदृढीकरण सीखना और अस्थायी-अंतर सीखना
व्यक्तिपरक और अपेक्षित मूल्य
ऑर्बिटोफ्रंटल और वेंट्रोमेडियल प्रीफ्रंटल मूल्यांकन
स्ट्रिएटम और कार्य मूल्य
अन्वेषण बनाम शोषण
पुरस्कार-संबंधित विकार

Key theories

डोपामाइन की पुरस्कार भविष्यवाणी-त्रुटि परिकल्पना: मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स की फेसिक गतिविधि एक पुरस्कार भविष्यवाणी त्रुटि को एन्कोड करती है, जो प्राप्त और अपेक्षित पुरस्कार के बीच का अंतर है, जो मूल्य अनुमानों को अद्यतन करने के लिए अस्थायी-अंतर सुदृढीकरण सीखने में उपयोग किए जाने वाले प्रकार का एक शिक्षण संकेत प्रदान करती है।
मूल्य-आधारित निर्णय-निर्माण ढाँचा: पसंद को चरणों में विघटित किया जाता है, विकल्पों का प्रतिनिधित्व, मूल्यांकन, कार्य चयन, परिणाम मूल्यांकन, और सीखना, जिससे अलग-अलग तंत्रिका प्रणालियों को प्रत्येक कम्प्यूटेशनल चरण पर मैप किया जा सकता है बजाय निर्णय को एक एकल प्रक्रिया के रूप में मानने के।

Mechanisms

एक केंद्रीय तंत्र पुरस्कार भविष्यवाणी त्रुटि है: मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स तब फायरिंग बढ़ाते हैं जब कोई परिणाम अपेक्षित से बेहतर होता है और तब फायरिंग घटाते हैं जब वह बदतर होता है, एक पैटर्न जो अस्थायी-अंतर सुदृढीकरण सीखने के शिक्षण संकेत से मेल खाता है (Schultz et al., 1997)। ऐसा माना जाता है कि ये संकेत लक्ष्य क्षेत्रों में मूल्य अभ्यावेदन को अद्यतन करते हैं, विशेष रूप से स्ट्रिएटम में, जहां न्यूरोनल गतिविधि उपलब्ध कार्यों के मूल्य को दर्शाती है (Samejima et al., 2005)। ऑर्बिटोफ्रंटल और वेंट्रोमेडियल प्रीफ्रंटल कॉर्टेक्स वस्तुओं और विकल्पों के मूल्य को एक सामान्य पैमाने पर दर्शाते हैं जो विकल्पों में तुलना की अनुमति देता है (Wallis, 2007)। निर्णय-निर्माण को कम्प्यूटेशनल चरणों, प्रतिनिधित्व, मूल्यांकन, चयन और सीखने के एक अनुक्रम के रूप में विश्लेषण किया जा सकता है, प्रत्येक आंशिक रूप से विशिष्ट परिपथों द्वारा समर्थित है (Rangel et al., 2008)।

Clinical relevance

पुरस्कार और मूल्यांकन परिपथ इस बात में शामिल हैं कि शोधकर्ता और चिकित्सक प्रेरणा और कई स्थितियों को कैसे समझते हैं, जिनमें लत, अवसाद, और डोपामिनर्जिक रोग और उपचार के प्रभाव शामिल हैं, जैसा कि पार्किंसन रोग में परिवर्तित सुदृढीकरण सीखने से दिखाया गया है (Frank et al., 2004)। यह प्रविष्टि पुरस्कार और निर्णय तंत्रों के लिए एक शैक्षिक संदर्भ है और किसी भी व्यक्ति के निदान या उपचार का आधार नहीं है।

Evidence & guidelines

यह विवरण जानवरों में एकल-इकाई रिकॉर्डिंग, मानव न्यूरोइमेजिंग, कम्प्यूटेशनल मॉडलिंग, और डोपामिनर्जिक विकारों वाले रोगियों के अध्ययनों से अभिसारी साक्ष्य पर आधारित है (Schultz et al., 1997; Samejima et al., 2005; Frank et al., 2004), जिसका मूल्यांकन और पसंद की प्रमुख समीक्षाओं में संश्लेषण किया गया है (Rangel et al., 2008; Wallis, 2007)।

History

1950 के दशक में शुरुआती विद्युत स्व-उत्तेजना प्रयोगों ने मस्तिष्क के उन क्षेत्रों की पहचान की जिनकी सक्रियता प्राप्त करने के लिए जानवर काम करेंगे, जिससे एक पुरस्कार प्रणाली का विचार स्थापित हुआ। 1980 और 1990 के दशक के दौरान, शुल्त्स और उनके सहयोगियों द्वारा मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स की रिकॉर्डिंग, जिसे सटन और बार्टो द्वारा विकसित और मोंटेग और डायन द्वारा लागू सुदृढीकरण-शिक्षण सिद्धांत के साथ व्याख्या किया गया, ने डोपामाइन को खुशी के संकेत के बजाय एक भविष्यवाणी-त्रुटि संकेत के रूप में फिर से परिभाषित किया। न्यूरोइकोनॉमिक्स का बाद में उद्भव मूल्य के आर्थिक सिद्धांतों को तंत्रिका विज्ञान के साथ एकीकृत करता है ताकि यह अध्ययन किया जा सके कि मस्तिष्क पसंद के दौरान मूल्य की गणना और तुलना कैसे करता है।

Debates

डोपामाइन वास्तव में क्या एन्कोड करता है?: भविष्यवाणी-त्रुटि खाता प्रभावशाली है, लेकिन इस बात पर बहस जारी है कि क्या फेसिक डोपामाइन संकेत सख्ती से एक पुरस्कार भविष्यवाणी त्रुटि है या यह प्रमुखता, नवीनता, या प्रेरक शक्ति को भी व्यक्त करता है, और टॉनिक और फेसिक संकेत कार्य में कैसे भिन्न होते हैं।

Key figures

Wolfram Schultz
Peter Dayan
P. Read Montague
Antonio Rangel
Michael Frank

Seminal works

schultz-1997
rangel-2008
wallis-2007

Frequently asked questions

पुरस्कार भविष्यवाणी त्रुटि क्या है?: यह उस पुरस्कार के बीच का अंतर है जो एक परिणाम प्रदान करता है और वह पुरस्कार जो अपेक्षित था। मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स इस अंतर का संकेत देते हैं, अपेक्षित से बेहतर परिणामों के लिए अधिक फायरिंग करते हैं और अपेक्षित से बदतर परिणामों के लिए कम फायरिंग करते हैं, जो एक सीखने का संकेत प्रदान करता है जो भविष्य की अपेक्षाओं को अद्यतन करता है।
क्या डोपामाइन मस्तिष्क का 'खुशी रसायन' है?: यह लोकप्रिय विवरण भ्रामक है। बहुत से साक्ष्य इंगित करते हैं कि फेसिक डोपामाइन संकेत मुख्य रूप से सीखने और पुरस्कार की भविष्यवाणी से संबंधित हैं, न कि खुशी के अनुभव से, जिसमें अन्य प्रणालियाँ शामिल प्रतीत होती हैं।