ScholarGate
सहायक

एजेंटों के लिए खेल सिद्धांत

खेल सिद्धांत तर्कसंगत एजेंटों के बीच रणनीतिक अंतःक्रिया का विश्लेषण करने के लिए गणितीय ढाँचा प्रदान करता है, यह भविष्यवाणी करता है कि स्व-हितैषी निर्णय लेने वाले कैसे व्यवहार करते हैं जब प्रत्येक का परिणाम दूसरों के विकल्पों पर निर्भर करता है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

खेल सिद्धांत उन स्थितियों का अध्ययन करता है जिनमें कई तर्कसंगत एजेंट प्रत्येक ऐसी क्रियाओं का चयन करते हैं जिनके प्रतिफल सभी एजेंटों के विकल्पों पर निर्भर करते हैं, और संतुलन जैसे समाधान अवधारणाओं के माध्यम से स्थिर या तर्कसंगत संयुक्त व्यवहार को चित्रित करता है।

Scope

यह विषय बहु-एजेंट एआई में उपयोग किए जाने वाले खेल-सैद्धांतिक आधारों को शामिल करता है: सामान्य-रूप और विस्तृत-रूप खेल, प्रभावी रणनीतियाँ, नैश संतुलन और उसका अस्तित्व, मिश्रित रणनीतियाँ, और कैदी की दुविधा और शून्य-योग खेल जैसे प्रमुख उदाहरण; साथ ही संतुलन की गणना के एल्गोरिथम संबंधी प्रश्न। यह इस बात पर ध्यान देता है कि एजेंट एक-दूसरे के बारे में कैसे तर्क करते हैं और कौन से संयुक्त व्यवहार स्थिर होते हैं। अंतःक्रिया नियमों के इंजीनियरिंग को तंत्र डिजाइन के तहत माना जाता है, और खेल खेलना मशीन-लर्निंग उपक्षेत्र से संबंधित है।

Core questions

  • रणनीतिक अंतःक्रियाओं को सामान्य या विस्तृत रूप में खेलों के रूप में कैसे दर्शाया जाता है?
  • कौन सी समाधान अवधारणाएँ (प्रभावी रणनीतियाँ, नैश संतुलन) भविष्यवाणी करती हैं कि तर्कसंगत एजेंट कैसे व्यवहार करते हैं?
  • संतुलन के अस्तित्व की गारंटी कब होती है, संभवतः मिश्रित रणनीतियों में?
  • संतुलन की गणना करना कितना कठिन है, और यह एजेंटों द्वारा उनके उपयोग को कैसे प्रभावित करता है?

Key concepts

  • सामान्य-रूप और विस्तृत-रूप खेल
  • प्रतिफल और रणनीतियाँ
  • प्रभावी रणनीति
  • नैश संतुलन
  • मिश्रित रणनीतियाँ
  • शून्य-योग खेल और मिनिमाक्स
  • कैदी की दुविधा
  • संतुलन गणना

Key theories

नैश संतुलन
नैश संतुलन रणनीतियों का एक प्रोफाइल है जिसमें कोई भी एजेंट अपनी रणनीति को एकतरफा बदलकर अपने प्रतिफल में सुधार नहीं कर सकता है; नैश ने साबित किया कि प्रत्येक परिमित खेल में कम से कम एक ऐसा संतुलन होता है, संभवतः मिश्रित रणनीतियों में।
शून्य-योग खेलों में मिनिमाक्स
दो-खिलाड़ी शून्य-योग खेलों में, वॉन न्यूमैन का मिनिमाक्स प्रमेय दोनों खिलाड़ियों के लिए एक मूल्य और इष्टतम (संभवतः यादृच्छिक) रणनीतियों की गारंटी देता है, जो खेल सिद्धांत को प्रतिकूल निर्णय लेने से जोड़ता है।
प्रभावी रणनीतियाँ और दुविधाएँ
प्रभावी रणनीतियों के माध्यम से खेलों का विश्लेषण कैदी की दुविधा जैसे परिणामों की व्याख्या करता है, जहाँ व्यक्तिगत रूप से तर्कसंगत विकल्प सामूहिक रूप से बदतर परिणाम की ओर ले जाते हैं, जो व्यक्तिगत और समूह तर्कसंगतता के बीच तनाव को दर्शाता है।

Clinical relevance

खेल-सैद्धांतिक विश्लेषण नीलामी और बाजारों, सुरक्षा और गश्त रणनीतियों, नेटवर्क रूटिंग और भीड़भाड़, और स्वचालित बातचीत के डिजाइन को सूचित करता है, यह भविष्यवाणी करके कि रणनीतिक एजेंट कैसे कार्य करेंगे और प्रतिस्पर्धी सेटिंग्स में स्थिर परिणामों की पहचान करेंगे।

History

खेल सिद्धांत की स्थापना वॉन न्यूमैन और मॉर्गनस्टर्न (1944) ने की थी और नैश की संतुलन अवधारणा (1950) द्वारा इसका विस्तार किया गया था। यह अर्थशास्त्र के लिए केंद्रीय बन गया और 1990 के दशक से, एल्गोरिथम खेल सिद्धांत के माध्यम से एआई और कंप्यूटर विज्ञान के लिए, जो संतुलन की कम्प्यूटेशनल जटिलता और बहु-एजेंट प्रणालियों में उनके उपयोग का अध्ययन करता है।

Key figures

  • John von Neumann
  • Oskar Morgenstern
  • John F. Nash
  • Yoav Shoham
  • Kevin Leyton-Brown

Related topics

Seminal works

  • nash1950
  • vonneumann1944
  • shoham2009

Frequently asked questions

नैश संतुलन क्या है?
नैश संतुलन रणनीतियों का एक संयोजन है, प्रत्येक एजेंट के लिए एक, जैसे कि कोई भी अकेला एजेंट अपनी रणनीति को बदलकर बेहतर प्रदर्शन नहीं कर सकता है जबकि अन्य अपनी रणनीतियों को स्थिर रखते हैं। यह स्थिर, पारस्परिक रूप से सुसंगत तर्कसंगत व्यवहार की एक धारणा को दर्शाता है।
कैदी की दुविधा एआई एजेंटों के लिए क्यों मायने रखती है?
कैदी की दुविधा दर्शाती है कि अपने स्वयं के तर्कसंगत स्वार्थ में कार्य करने वाले एजेंट एक ऐसे परिणाम तक पहुँच सकते हैं जो उन सभी के लिए बदतर है यदि उन्होंने सहयोग किया होता। यह इस बात पर प्रकाश डालता है कि स्व-हितैषी एजेंटों की प्रणालियों का निर्माण करते समय प्रोत्साहन और समन्वय तंत्र को डिजाइन करना क्यों महत्वपूर्ण है।

Methods for this concept

Related concepts