ScholarGate
सहायक

पुरस्कार और निर्णय-निर्माण

पुरस्कार प्रसंस्करण और मूल्य-आधारित निर्णय-निर्माण इस बात से संबंधित हैं कि मस्तिष्क परिणामों के मूल्य का प्रतिनिधित्व कैसे करता है, कार्यों के परिणामों से कैसे सीखता है, और विकल्पों में से कैसे चुनता है। मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स अपेक्षित और प्राप्त पुरस्कार के बीच विसंगतियों का संकेत देते हैं, और स्ट्रिएटम, ऑर्बिटोफ्रंटल और वेंट्रोमेडियल प्रीफ्रंटल कॉर्टेक्स सहित एक नेटवर्क व्यवहार को निर्देशित करने के लिए विकल्पों के मूल्य की गणना और तुलना करता है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

पुरस्कार और निर्णय-निर्माण इस बात का अध्ययन है कि मस्तिष्क परिणामों को कैसे महत्व देता है, भविष्यवाणी त्रुटियों से सीखने के माध्यम से अपेक्षाओं को अद्यतन करता है, और प्रतिस्पर्धी कार्यों में से चयन करने के लिए इन मूल्य अभ्यावेदन का उपयोग कैसे करता है।

Scope

यह विषय संज्ञानात्मक तंत्रिका विज्ञान में संदर्भ सामग्री के रूप में पुरस्कार और मूल्य-आधारित निर्णय-निर्माण के तंत्रिका विज्ञान को शामिल करता है। यह पुरस्कार भविष्यवाणी-त्रुटि संकेत, मस्तिष्क की मूल्यांकन प्रणालियों, सुदृढीकरण-शिक्षण ढाँचों, और प्रेरणा तथा पुरस्कार के विकारों के लिए इन परिपथों की प्रासंगिकता का परिचय देता है। यह तंत्र और साक्ष्य की व्याख्या करता है और नैदानिक मार्गदर्शन नहीं है।

Core questions

  • मस्तिष्क विभिन्न परिणामों और विकल्पों के मूल्य का प्रतिनिधित्व कैसे करता है?
  • डोपामाइन संकेत और सुदृढीकरण-शिक्षण तंत्र मस्तिष्क को पुरस्कार और दंड से सीखने की अनुमति कैसे देते हैं?
  • निर्णय-निर्माण के दौरान कौन से क्षेत्र मूल्य की गणना, तुलना और उस पर कार्य करते हैं?

Key concepts

  • पुरस्कार भविष्यवाणी त्रुटि
  • फेसिक डोपामाइन संकेत
  • सुदृढीकरण सीखना और अस्थायी-अंतर सीखना
  • व्यक्तिपरक और अपेक्षित मूल्य
  • ऑर्बिटोफ्रंटल और वेंट्रोमेडियल प्रीफ्रंटल मूल्यांकन
  • स्ट्रिएटम और कार्य मूल्य
  • अन्वेषण बनाम शोषण
  • पुरस्कार-संबंधित विकार

Key theories

डोपामाइन की पुरस्कार भविष्यवाणी-त्रुटि परिकल्पना
मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स की फेसिक गतिविधि एक पुरस्कार भविष्यवाणी त्रुटि को एन्कोड करती है, जो प्राप्त और अपेक्षित पुरस्कार के बीच का अंतर है, जो मूल्य अनुमानों को अद्यतन करने के लिए अस्थायी-अंतर सुदृढीकरण सीखने में उपयोग किए जाने वाले प्रकार का एक शिक्षण संकेत प्रदान करती है।
मूल्य-आधारित निर्णय-निर्माण ढाँचा
पसंद को चरणों में विघटित किया जाता है, विकल्पों का प्रतिनिधित्व, मूल्यांकन, कार्य चयन, परिणाम मूल्यांकन, और सीखना, जिससे अलग-अलग तंत्रिका प्रणालियों को प्रत्येक कम्प्यूटेशनल चरण पर मैप किया जा सकता है बजाय निर्णय को एक एकल प्रक्रिया के रूप में मानने के।

Mechanisms

एक केंद्रीय तंत्र पुरस्कार भविष्यवाणी त्रुटि है: मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स तब फायरिंग बढ़ाते हैं जब कोई परिणाम अपेक्षित से बेहतर होता है और तब फायरिंग घटाते हैं जब वह बदतर होता है, एक पैटर्न जो अस्थायी-अंतर सुदृढीकरण सीखने के शिक्षण संकेत से मेल खाता है (Schultz et al., 1997)। ऐसा माना जाता है कि ये संकेत लक्ष्य क्षेत्रों में मूल्य अभ्यावेदन को अद्यतन करते हैं, विशेष रूप से स्ट्रिएटम में, जहां न्यूरोनल गतिविधि उपलब्ध कार्यों के मूल्य को दर्शाती है (Samejima et al., 2005)। ऑर्बिटोफ्रंटल और वेंट्रोमेडियल प्रीफ्रंटल कॉर्टेक्स वस्तुओं और विकल्पों के मूल्य को एक सामान्य पैमाने पर दर्शाते हैं जो विकल्पों में तुलना की अनुमति देता है (Wallis, 2007)। निर्णय-निर्माण को कम्प्यूटेशनल चरणों, प्रतिनिधित्व, मूल्यांकन, चयन और सीखने के एक अनुक्रम के रूप में विश्लेषण किया जा सकता है, प्रत्येक आंशिक रूप से विशिष्ट परिपथों द्वारा समर्थित है (Rangel et al., 2008)।

Clinical relevance

पुरस्कार और मूल्यांकन परिपथ इस बात में शामिल हैं कि शोधकर्ता और चिकित्सक प्रेरणा और कई स्थितियों को कैसे समझते हैं, जिनमें लत, अवसाद, और डोपामिनर्जिक रोग और उपचार के प्रभाव शामिल हैं, जैसा कि पार्किंसन रोग में परिवर्तित सुदृढीकरण सीखने से दिखाया गया है (Frank et al., 2004)। यह प्रविष्टि पुरस्कार और निर्णय तंत्रों के लिए एक शैक्षिक संदर्भ है और किसी भी व्यक्ति के निदान या उपचार का आधार नहीं है।

Evidence & guidelines

यह विवरण जानवरों में एकल-इकाई रिकॉर्डिंग, मानव न्यूरोइमेजिंग, कम्प्यूटेशनल मॉडलिंग, और डोपामिनर्जिक विकारों वाले रोगियों के अध्ययनों से अभिसारी साक्ष्य पर आधारित है (Schultz et al., 1997; Samejima et al., 2005; Frank et al., 2004), जिसका मूल्यांकन और पसंद की प्रमुख समीक्षाओं में संश्लेषण किया गया है (Rangel et al., 2008; Wallis, 2007)।

History

1950 के दशक में शुरुआती विद्युत स्व-उत्तेजना प्रयोगों ने मस्तिष्क के उन क्षेत्रों की पहचान की जिनकी सक्रियता प्राप्त करने के लिए जानवर काम करेंगे, जिससे एक पुरस्कार प्रणाली का विचार स्थापित हुआ। 1980 और 1990 के दशक के दौरान, शुल्त्स और उनके सहयोगियों द्वारा मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स की रिकॉर्डिंग, जिसे सटन और बार्टो द्वारा विकसित और मोंटेग और डायन द्वारा लागू सुदृढीकरण-शिक्षण सिद्धांत के साथ व्याख्या किया गया, ने डोपामाइन को खुशी के संकेत के बजाय एक भविष्यवाणी-त्रुटि संकेत के रूप में फिर से परिभाषित किया। न्यूरोइकोनॉमिक्स का बाद में उद्भव मूल्य के आर्थिक सिद्धांतों को तंत्रिका विज्ञान के साथ एकीकृत करता है ताकि यह अध्ययन किया जा सके कि मस्तिष्क पसंद के दौरान मूल्य की गणना और तुलना कैसे करता है।

Debates

डोपामाइन वास्तव में क्या एन्कोड करता है?
भविष्यवाणी-त्रुटि खाता प्रभावशाली है, लेकिन इस बात पर बहस जारी है कि क्या फेसिक डोपामाइन संकेत सख्ती से एक पुरस्कार भविष्यवाणी त्रुटि है या यह प्रमुखता, नवीनता, या प्रेरक शक्ति को भी व्यक्त करता है, और टॉनिक और फेसिक संकेत कार्य में कैसे भिन्न होते हैं।

Key figures

  • Wolfram Schultz
  • Peter Dayan
  • P. Read Montague
  • Antonio Rangel
  • Michael Frank

Related topics

Seminal works

  • schultz-1997
  • rangel-2008
  • wallis-2007

Frequently asked questions

पुरस्कार भविष्यवाणी त्रुटि क्या है?
यह उस पुरस्कार के बीच का अंतर है जो एक परिणाम प्रदान करता है और वह पुरस्कार जो अपेक्षित था। मध्य-मस्तिष्क डोपामाइन न्यूरॉन्स इस अंतर का संकेत देते हैं, अपेक्षित से बेहतर परिणामों के लिए अधिक फायरिंग करते हैं और अपेक्षित से बदतर परिणामों के लिए कम फायरिंग करते हैं, जो एक सीखने का संकेत प्रदान करता है जो भविष्य की अपेक्षाओं को अद्यतन करता है।
क्या डोपामाइन मस्तिष्क का 'खुशी रसायन' है?
यह लोकप्रिय विवरण भ्रामक है। बहुत से साक्ष्य इंगित करते हैं कि फेसिक डोपामाइन संकेत मुख्य रूप से सीखने और पुरस्कार की भविष्यवाणी से संबंधित हैं, न कि खुशी के अनुभव से, जिसमें अन्य प्रणालियाँ शामिल प्रतीत होती हैं।

Methods for this concept

Related concepts