博弈论与智能体
博弈论提供了一个数学框架,用于分析理性智能体之间的策略互动,预测自利决策者在各自结果取决于他人选择时将如何行动。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
博弈论研究的是多个理性智能体各自选择行动的情境,其收益取决于所有智能体的选择,并通过均衡等解决方案概念来刻画稳定或理性的联合行为。
Scope
本主题涵盖了多智能体AI中使用的博弈论基础:范式博弈和扩展式博弈、优势策略、纳什均衡及其存在性、混合策略,以及囚徒困境和零和博弈等关键示例;同时涉及均衡计算的算法问题。它探讨了智能体如何相互推理以及哪些联合行为是稳定的。互动规则的设计在机制设计中处理,而学习博弈则属于机器学习的子领域。
Core questions
- 策略互动如何以范式或扩展式博弈的形式表示?
- 哪些解决方案概念(优势策略、纳什均衡)可以预测理性智能体的行为?
- 何时能保证均衡的存在,可能是在混合策略中?
- 计算均衡有多困难,这如何影响智能体对它们的使用?
Key concepts
- 范式博弈和扩展式博弈
- 收益和策略
- 优势策略
- 纳什均衡
- 混合策略
- 零和博弈和最小最大
- 囚徒困境
- 均衡计算
Key theories
- 纳什均衡
- 纳什均衡是一种策略组合,其中任何智能体都不能通过单方面改变自己的策略来提高收益;纳什证明了每个有限博弈都至少存在一个这样的均衡,可能是在混合策略中。
- 零和博弈中的最小最大
- 在两人零和博弈中,冯·诺依曼的最小最大定理保证了双方玩家的价值和最优(可能是随机的)策略,将博弈论与对抗性决策联系起来。
- 优势策略与困境
- 通过优势策略分析博弈可以解释囚徒困境等结果,其中个体理性选择导致集体更差的结果,说明了个体与群体理性之间的张力。
Clinical relevance
博弈论分析通过预测策略智能体将如何行动以及识别竞争环境中的稳定结果,为拍卖和市场设计、安全和巡逻策略、网络路由和拥堵以及自动化谈判提供了信息。
History
博弈论由冯·诺依曼和摩根斯坦(1944)创立,并由纳什的均衡概念(1950)扩展。它成为经济学的核心,并从1990年代开始,通过算法博弈论进入人工智能和计算机科学领域,算法博弈论研究均衡的计算复杂性及其在多智能体系统中的应用。
Key figures
- John von Neumann
- Oskar Morgenstern
- John F. Nash
- Yoav Shoham
- Kevin Leyton-Brown
Related topics
Seminal works
- nash1950
- vonneumann1944
- shoham2009
Frequently asked questions
- 什么是纳什均衡?
- 纳什均衡是一种策略组合,每个智能体一个策略,使得在其他智能体保持策略不变的情况下,任何单个智能体都无法通过仅改变自己的策略来获得更好的结果。它捕捉了稳定、相互一致的理性行为的概念。
- 为什么囚徒困境对AI智能体很重要?
- 囚徒困境表明,智能体出于自身理性自利的行为可能会导致对所有智能体而言都比合作更糟糕的结果。它强调了在构建自利智能体系统时,设计激励和协调机制的重要性。