Théorie des jeux pour les agents
La théorie des jeux offre le cadre mathématique pour analyser les interactions stratégiques entre agents rationnels, en prédisant comment des décideurs motivés par leur propre intérêt se comportent lorsque le résultat de chacun dépend des choix des autres.
Definition
La théorie des jeux étudie les situations dans lesquelles plusieurs agents rationnels choisissent chacun des actions dont les gains dépendent des choix de tous les agents, et caractérise les comportements conjoints stables ou rationnels au moyen de concepts de solution tels que les équilibres.
Scope
Ce sujet couvre les fondements de la théorie des jeux utilisés en IA multi-agents : les jeux sous forme normale et sous forme extensive, les stratégies dominantes, l'équilibre de Nash et son existence, les stratégies mixtes, et des exemples clés tels que le dilemme du prisonnier et les jeux à somme nulle ; ainsi que les questions algorithmiques de calcul des équilibres. Il aborde la manière dont les agents raisonnent les uns sur les autres et quels comportements conjoints sont stables. L'ingénierie des règles d'interaction est traitée dans le cadre de la conception de mécanismes (mechanism design), et l'apprentissage du jeu relève du sous-domaine de l'apprentissage automatique (machine learning).
Core questions
- Comment les interactions stratégiques sont-elles représentées sous forme de jeux en forme normale ou extensive ?
- Quels concepts de solution (stratégies dominantes, équilibre de Nash) prédisent le comportement des agents rationnels ?
- Quand l'existence d'un équilibre est-elle garantie, éventuellement en stratégies mixtes ?
- Quelle est la difficulté de calculer les équilibres, et comment cela affecte-t-il leur utilisation par les agents ?
Key concepts
- jeux sous forme normale et sous forme extensive
- gains et stratégies
- stratégie dominante
- équilibre de Nash
- stratégies mixtes
- jeux à somme nulle et minimax
- dilemme du prisonnier
- calcul d'équilibre
Key theories
- Équilibre de Nash
- Un équilibre de Nash est un profil de stratégies dans lequel aucun agent ne peut améliorer son gain en modifiant unilatéralement sa propre stratégie ; Nash a prouvé que tout jeu fini possède au moins un tel équilibre, éventuellement en stratégies mixtes.
- Minimax dans les jeux à somme nulle
- Dans les jeux à somme nulle à deux joueurs, le théorème du minimax de von Neumann garantit une valeur et des stratégies optimales (éventuellement aléatoires) pour les deux joueurs, reliant la théorie des jeux à la prise de décision adversaire.
- Stratégies dominantes et dilemmes
- L'analyse des jeux via les stratégies dominantes explique des résultats tels que le dilemme du prisonnier, où des choix individuellement rationnels conduisent à un résultat collectivement pire, illustrant la tension entre la rationalité individuelle et collective.
Clinical relevance
L'analyse par la théorie des jeux éclaire la conception des enchères et des marchés, les stratégies de sécurité et de patrouille, le routage et la congestion des réseaux, ainsi que la négociation automatisée, en prédisant comment les agents stratégiques agiront et en identifiant les résultats stables dans des contextes compétitifs.
History
La théorie des jeux a été fondée par von Neumann et Morgenstern (1944) et étendue par le concept d'équilibre de Nash (1950). Elle est devenue centrale en économie et, à partir des années 1990, en IA et en informatique grâce à la théorie algorithmique des jeux, qui étudie la complexité computationnelle des équilibres et leur utilisation dans les systèmes multi-agents.
Key figures
- John von Neumann
- Oskar Morgenstern
- John F. Nash
- Yoav Shoham
- Kevin Leyton-Brown
Related topics
Seminal works
- nash1950
- vonneumann1944
- shoham2009
Frequently asked questions
- Qu'est-ce qu'un équilibre de Nash ?
- Un équilibre de Nash est une combinaison de stratégies, une par agent, telle qu'aucun agent ne peut améliorer sa situation en ne modifiant que sa propre stratégie, tandis que les autres maintiennent les leurs. Il représente une notion de comportement rationnel stable et mutuellement cohérent.
- Pourquoi le dilemme du prisonnier est-il pertinent pour les agents d'IA ?
- Le dilemme du prisonnier montre que des agents agissant dans leur propre intérêt rationnel peuvent aboutir à un résultat qui est pire pour tous que s'ils avaient coopéré. Il souligne l'importance de concevoir des incitations et des mécanismes de coordination lors de la construction de systèmes d'agents motivés par leur propre intérêt.