नैश संतुलन क्या है?

नैश संतुलन रणनीतियों का एक संयोजन है, प्रत्येक एजेंट के लिए एक, जैसे कि कोई भी अकेला एजेंट अपनी रणनीति को बदलकर बेहतर प्रदर्शन नहीं कर सकता है जबकि अन्य अपनी रणनीतियों को स्थिर रखते हैं। यह स्थिर, पारस्परिक रूप से सुसंगत तर्कसंगत व्यवहार की एक धारणा को दर्शाता है।

कैदी की दुविधा एआई एजेंटों के लिए क्यों मायने रखती है?

कैदी की दुविधा दर्शाती है कि अपने स्वयं के तर्कसंगत स्वार्थ में कार्य करने वाले एजेंट एक ऐसे परिणाम तक पहुँच सकते हैं जो उन सभी के लिए बदतर है यदि उन्होंने सहयोग किया होता। यह इस बात पर प्रकाश डालता है कि स्व-हितैषी एजेंटों की प्रणालियों का निर्माण करते समय प्रोत्साहन और समन्वय तंत्र को डिजाइन करना क्यों महत्वपूर्ण है।

एजेंटों के लिए खेल सिद्धांत

खेल सिद्धांत तर्कसंगत एजेंटों के बीच रणनीतिक अंतःक्रिया का विश्लेषण करने के लिए गणितीय ढाँचा प्रदान करता है, यह भविष्यवाणी करता है कि स्व-हितैषी निर्णय लेने वाले कैसे व्यवहार करते हैं जब प्रत्येक का परिणाम दूसरों के विकल्पों पर निर्भर करता है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

खेल सिद्धांत उन स्थितियों का अध्ययन करता है जिनमें कई तर्कसंगत एजेंट प्रत्येक ऐसी क्रियाओं का चयन करते हैं जिनके प्रतिफल सभी एजेंटों के विकल्पों पर निर्भर करते हैं, और संतुलन जैसे समाधान अवधारणाओं के माध्यम से स्थिर या तर्कसंगत संयुक्त व्यवहार को चित्रित करता है।

Scope

यह विषय बहु-एजेंट एआई में उपयोग किए जाने वाले खेल-सैद्धांतिक आधारों को शामिल करता है: सामान्य-रूप और विस्तृत-रूप खेल, प्रभावी रणनीतियाँ, नैश संतुलन और उसका अस्तित्व, मिश्रित रणनीतियाँ, और कैदी की दुविधा और शून्य-योग खेल जैसे प्रमुख उदाहरण; साथ ही संतुलन की गणना के एल्गोरिथम संबंधी प्रश्न। यह इस बात पर ध्यान देता है कि एजेंट एक-दूसरे के बारे में कैसे तर्क करते हैं और कौन से संयुक्त व्यवहार स्थिर होते हैं। अंतःक्रिया नियमों के इंजीनियरिंग को तंत्र डिजाइन के तहत माना जाता है, और खेल खेलना मशीन-लर्निंग उपक्षेत्र से संबंधित है।

Core questions

रणनीतिक अंतःक्रियाओं को सामान्य या विस्तृत रूप में खेलों के रूप में कैसे दर्शाया जाता है?
कौन सी समाधान अवधारणाएँ (प्रभावी रणनीतियाँ, नैश संतुलन) भविष्यवाणी करती हैं कि तर्कसंगत एजेंट कैसे व्यवहार करते हैं?
संतुलन के अस्तित्व की गारंटी कब होती है, संभवतः मिश्रित रणनीतियों में?
संतुलन की गणना करना कितना कठिन है, और यह एजेंटों द्वारा उनके उपयोग को कैसे प्रभावित करता है?

Key concepts

सामान्य-रूप और विस्तृत-रूप खेल
प्रतिफल और रणनीतियाँ
प्रभावी रणनीति
नैश संतुलन
मिश्रित रणनीतियाँ
शून्य-योग खेल और मिनिमाक्स
कैदी की दुविधा
संतुलन गणना

Key theories

नैश संतुलन: नैश संतुलन रणनीतियों का एक प्रोफाइल है जिसमें कोई भी एजेंट अपनी रणनीति को एकतरफा बदलकर अपने प्रतिफल में सुधार नहीं कर सकता है; नैश ने साबित किया कि प्रत्येक परिमित खेल में कम से कम एक ऐसा संतुलन होता है, संभवतः मिश्रित रणनीतियों में।
शून्य-योग खेलों में मिनिमाक्स: दो-खिलाड़ी शून्य-योग खेलों में, वॉन न्यूमैन का मिनिमाक्स प्रमेय दोनों खिलाड़ियों के लिए एक मूल्य और इष्टतम (संभवतः यादृच्छिक) रणनीतियों की गारंटी देता है, जो खेल सिद्धांत को प्रतिकूल निर्णय लेने से जोड़ता है।
प्रभावी रणनीतियाँ और दुविधाएँ: प्रभावी रणनीतियों के माध्यम से खेलों का विश्लेषण कैदी की दुविधा जैसे परिणामों की व्याख्या करता है, जहाँ व्यक्तिगत रूप से तर्कसंगत विकल्प सामूहिक रूप से बदतर परिणाम की ओर ले जाते हैं, जो व्यक्तिगत और समूह तर्कसंगतता के बीच तनाव को दर्शाता है।

Clinical relevance

खेल-सैद्धांतिक विश्लेषण नीलामी और बाजारों, सुरक्षा और गश्त रणनीतियों, नेटवर्क रूटिंग और भीड़भाड़, और स्वचालित बातचीत के डिजाइन को सूचित करता है, यह भविष्यवाणी करके कि रणनीतिक एजेंट कैसे कार्य करेंगे और प्रतिस्पर्धी सेटिंग्स में स्थिर परिणामों की पहचान करेंगे।

History

खेल सिद्धांत की स्थापना वॉन न्यूमैन और मॉर्गनस्टर्न (1944) ने की थी और नैश की संतुलन अवधारणा (1950) द्वारा इसका विस्तार किया गया था। यह अर्थशास्त्र के लिए केंद्रीय बन गया और 1990 के दशक से, एल्गोरिथम खेल सिद्धांत के माध्यम से एआई और कंप्यूटर विज्ञान के लिए, जो संतुलन की कम्प्यूटेशनल जटिलता और बहु-एजेंट प्रणालियों में उनके उपयोग का अध्ययन करता है।

Key figures

John von Neumann
Oskar Morgenstern
John F. Nash
Yoav Shoham
Kevin Leyton-Brown

Seminal works

nash1950
vonneumann1944
shoham2009

Frequently asked questions

नैश संतुलन क्या है?: नैश संतुलन रणनीतियों का एक संयोजन है, प्रत्येक एजेंट के लिए एक, जैसे कि कोई भी अकेला एजेंट अपनी रणनीति को बदलकर बेहतर प्रदर्शन नहीं कर सकता है जबकि अन्य अपनी रणनीतियों को स्थिर रखते हैं। यह स्थिर, पारस्परिक रूप से सुसंगत तर्कसंगत व्यवहार की एक धारणा को दर्शाता है।
कैदी की दुविधा एआई एजेंटों के लिए क्यों मायने रखती है?: कैदी की दुविधा दर्शाती है कि अपने स्वयं के तर्कसंगत स्वार्थ में कार्य करने वाले एजेंट एक ऐसे परिणाम तक पहुँच सकते हैं जो उन सभी के लिए बदतर है यदि उन्होंने सहयोग किया होता। यह इस बात पर प्रकाश डालता है कि स्व-हितैषी एजेंटों की प्रणालियों का निर्माण करते समय प्रोत्साहन और समन्वय तंत्र को डिजाइन करना क्यों महत्वपूर्ण है।