多智能体系统
多智能体系统研究多个自主、交互的智能体——每个智能体都有自己的信息、目标和决策——如何协调、合作或竞争以实现个体或集体的结果。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
多智能体系统是由多个自主智能体组成的系统,这些智能体在共享环境中进行交互,每个智能体感知、决策和行动,其结果共同取决于智能体的选择。
Scope
该领域涵盖由许多交互智能体组成的系统及其交互的原则:战略行为和均衡的博弈论分析、智能体之间的协调与合作、分布式问题解决和约束满足,以及用于设计具有理想属性的交互的机制设计。它将智能体视为决策者,其选择相互影响。单个智能体的内部决策理论机制属于不确定性推理范畴,而交互学习则属于机器学习子领域。
Sub-topics
Core questions
- 自利智能体如何进行策略性行为,以及会产生哪些稳定的结果(均衡)?
- 智能体如何协调其行动并为共享或兼容的目标进行合作?
- 如何通过将问题分配给多个具有部分信息的智能体来解决问题?
- 如何设计交互规则,以使系统范围内的理想结果得以实现?
Key concepts
- 自主智能体
- 策略性交互和博弈论
- 纳什均衡
- 协调与协商
- 合作与团队协作
- 分布式问题解决
- 机制设计与拍卖
- 智能体通信
Key theories
- 博弈论均衡分析
- 博弈论将智能体建模为理性决策者,其收益取决于其他智能体的行动,而纳什均衡等均衡概念预测稳定的联合行为,为智能体之间的策略性交互提供了分析基础。
- 协调与合作
- 信息有限且目标重叠的智能体必须进行协调以避免冲突,并进行合作以实现共同结果,这需要使用多智能体系统文献中研究的协议、协商和共享约定。
- 作为逆向博弈论的机制设计
- 机制设计旨在设计交互规则,即使智能体出于自身利益行事,所产生的均衡也能实现设计者的目标,例如效率或真实行为。
Clinical relevance
多智能体技术应用于自动化交易和拍卖、电子市场、交通和网络路由、分布式传感器网络、机器人团队和蜂群、供应链以及在线平台的设计,凡是存在许多决策者互动且需要管理其激励和协调的场景。
History
多智能体系统起源于20世纪80年代的分布式人工智能,将智能体理论与博弈论和经济学相结合。20世纪90年代和21世纪初,智能体架构、通信标准和博弈论基础得到了巩固,如Wooldridge (2009) 和 Shoham 和 Leyton-Brown (2009) 的著作所述,其中机制设计和拍卖成为一个主要的实际应用方向。
Key figures
- Michael Wooldridge
- Yoav Shoham
- Kevin Leyton-Brown
- Nicholas R. Jennings
- Katia Sycara
Related topics
Seminal works
- shoham2009
- wooldridge2009
- jennings1998
Frequently asked questions
- 多智能体系统与单个智能体有何不同?
- 单个智能体推理并行动以在环境中实现自身目标。在多智能体系统中,多个自主智能体同时行动,因此每个智能体的最佳选择取决于其他智能体的行为。这引入了单个智能体AI不面临的策略性交互、协调和激励问题。
- 为什么博弈论对多智能体系统至关重要?
- 由于多智能体系统中的结果取决于自利智能体的联合行动,博弈论提供了预测稳定行为(均衡)和设计交互的工具。它使研究人员能够以原则性的方式推理竞争、合作和激励。