एजेंटों के लिए खेल सिद्धांत
खेल सिद्धांत तर्कसंगत एजेंटों के बीच रणनीतिक अंतःक्रिया का विश्लेषण करने के लिए गणितीय ढाँचा प्रदान करता है, यह भविष्यवाणी करता है कि स्व-हितैषी निर्णय लेने वाले कैसे व्यवहार करते हैं जब प्रत्येक का परिणाम दूसरों के विकल्पों पर निर्भर करता है।
Definition
खेल सिद्धांत उन स्थितियों का अध्ययन करता है जिनमें कई तर्कसंगत एजेंट प्रत्येक ऐसी क्रियाओं का चयन करते हैं जिनके प्रतिफल सभी एजेंटों के विकल्पों पर निर्भर करते हैं, और संतुलन जैसे समाधान अवधारणाओं के माध्यम से स्थिर या तर्कसंगत संयुक्त व्यवहार को चित्रित करता है।
Scope
यह विषय बहु-एजेंट एआई में उपयोग किए जाने वाले खेल-सैद्धांतिक आधारों को शामिल करता है: सामान्य-रूप और विस्तृत-रूप खेल, प्रभावी रणनीतियाँ, नैश संतुलन और उसका अस्तित्व, मिश्रित रणनीतियाँ, और कैदी की दुविधा और शून्य-योग खेल जैसे प्रमुख उदाहरण; साथ ही संतुलन की गणना के एल्गोरिथम संबंधी प्रश्न। यह इस बात पर ध्यान देता है कि एजेंट एक-दूसरे के बारे में कैसे तर्क करते हैं और कौन से संयुक्त व्यवहार स्थिर होते हैं। अंतःक्रिया नियमों के इंजीनियरिंग को तंत्र डिजाइन के तहत माना जाता है, और खेल खेलना मशीन-लर्निंग उपक्षेत्र से संबंधित है।
Core questions
- रणनीतिक अंतःक्रियाओं को सामान्य या विस्तृत रूप में खेलों के रूप में कैसे दर्शाया जाता है?
- कौन सी समाधान अवधारणाएँ (प्रभावी रणनीतियाँ, नैश संतुलन) भविष्यवाणी करती हैं कि तर्कसंगत एजेंट कैसे व्यवहार करते हैं?
- संतुलन के अस्तित्व की गारंटी कब होती है, संभवतः मिश्रित रणनीतियों में?
- संतुलन की गणना करना कितना कठिन है, और यह एजेंटों द्वारा उनके उपयोग को कैसे प्रभावित करता है?
Key concepts
- सामान्य-रूप और विस्तृत-रूप खेल
- प्रतिफल और रणनीतियाँ
- प्रभावी रणनीति
- नैश संतुलन
- मिश्रित रणनीतियाँ
- शून्य-योग खेल और मिनिमाक्स
- कैदी की दुविधा
- संतुलन गणना
Key theories
- नैश संतुलन
- नैश संतुलन रणनीतियों का एक प्रोफाइल है जिसमें कोई भी एजेंट अपनी रणनीति को एकतरफा बदलकर अपने प्रतिफल में सुधार नहीं कर सकता है; नैश ने साबित किया कि प्रत्येक परिमित खेल में कम से कम एक ऐसा संतुलन होता है, संभवतः मिश्रित रणनीतियों में।
- शून्य-योग खेलों में मिनिमाक्स
- दो-खिलाड़ी शून्य-योग खेलों में, वॉन न्यूमैन का मिनिमाक्स प्रमेय दोनों खिलाड़ियों के लिए एक मूल्य और इष्टतम (संभवतः यादृच्छिक) रणनीतियों की गारंटी देता है, जो खेल सिद्धांत को प्रतिकूल निर्णय लेने से जोड़ता है।
- प्रभावी रणनीतियाँ और दुविधाएँ
- प्रभावी रणनीतियों के माध्यम से खेलों का विश्लेषण कैदी की दुविधा जैसे परिणामों की व्याख्या करता है, जहाँ व्यक्तिगत रूप से तर्कसंगत विकल्प सामूहिक रूप से बदतर परिणाम की ओर ले जाते हैं, जो व्यक्तिगत और समूह तर्कसंगतता के बीच तनाव को दर्शाता है।
Clinical relevance
खेल-सैद्धांतिक विश्लेषण नीलामी और बाजारों, सुरक्षा और गश्त रणनीतियों, नेटवर्क रूटिंग और भीड़भाड़, और स्वचालित बातचीत के डिजाइन को सूचित करता है, यह भविष्यवाणी करके कि रणनीतिक एजेंट कैसे कार्य करेंगे और प्रतिस्पर्धी सेटिंग्स में स्थिर परिणामों की पहचान करेंगे।
History
खेल सिद्धांत की स्थापना वॉन न्यूमैन और मॉर्गनस्टर्न (1944) ने की थी और नैश की संतुलन अवधारणा (1950) द्वारा इसका विस्तार किया गया था। यह अर्थशास्त्र के लिए केंद्रीय बन गया और 1990 के दशक से, एल्गोरिथम खेल सिद्धांत के माध्यम से एआई और कंप्यूटर विज्ञान के लिए, जो संतुलन की कम्प्यूटेशनल जटिलता और बहु-एजेंट प्रणालियों में उनके उपयोग का अध्ययन करता है।
Key figures
- John von Neumann
- Oskar Morgenstern
- John F. Nash
- Yoav Shoham
- Kevin Leyton-Brown
Related topics
Seminal works
- nash1950
- vonneumann1944
- shoham2009
Frequently asked questions
- नैश संतुलन क्या है?
- नैश संतुलन रणनीतियों का एक संयोजन है, प्रत्येक एजेंट के लिए एक, जैसे कि कोई भी अकेला एजेंट अपनी रणनीति को बदलकर बेहतर प्रदर्शन नहीं कर सकता है जबकि अन्य अपनी रणनीतियों को स्थिर रखते हैं। यह स्थिर, पारस्परिक रूप से सुसंगत तर्कसंगत व्यवहार की एक धारणा को दर्शाता है।
- कैदी की दुविधा एआई एजेंटों के लिए क्यों मायने रखती है?
- कैदी की दुविधा दर्शाती है कि अपने स्वयं के तर्कसंगत स्वार्थ में कार्य करने वाले एजेंट एक ऐसे परिणाम तक पहुँच सकते हैं जो उन सभी के लिए बदतर है यदि उन्होंने सहयोग किया होता। यह इस बात पर प्रकाश डालता है कि स्व-हितैषी एजेंटों की प्रणालियों का निर्माण करते समय प्रोत्साहन और समन्वय तंत्र को डिजाइन करना क्यों महत्वपूर्ण है।