多智能体系统与单个智能体有何不同？

单个智能体推理并行动以在环境中实现自身目标。在多智能体系统中，多个自主智能体同时行动，因此每个智能体的最佳选择取决于其他智能体的行为。这引入了单个智能体AI不面临的策略性交互、协调和激励问题。

为什么博弈论对多智能体系统至关重要？

由于多智能体系统中的结果取决于自利智能体的联合行动，博弈论提供了预测稳定行为（均衡）和设计交互的工具。它使研究人员能够以原则性的方式推理竞争、合作和激励。

多智能体系统

多智能体系统研究多个自主、交互的智能体——每个智能体都有自己的信息、目标和决策——如何协调、合作或竞争以实现个体或集体的结果。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

下载幻灯片

Learn & explore

视频即将推出

Definition

多智能体系统是由多个自主智能体组成的系统，这些智能体在共享环境中进行交互，每个智能体感知、决策和行动，其结果共同取决于智能体的选择。

Scope

该领域涵盖由许多交互智能体组成的系统及其交互的原则：战略行为和均衡的博弈论分析、智能体之间的协调与合作、分布式问题解决和约束满足，以及用于设计具有理想属性的交互的机制设计。它将智能体视为决策者，其选择相互影响。单个智能体的内部决策理论机制属于不确定性推理范畴，而交互学习则属于机器学习子领域。

Sub-topics

Core questions

自利智能体如何进行策略性行为，以及会产生哪些稳定的结果（均衡）？
智能体如何协调其行动并为共享或兼容的目标进行合作？
如何通过将问题分配给多个具有部分信息的智能体来解决问题？
如何设计交互规则，以使系统范围内的理想结果得以实现？

Key concepts

自主智能体
策略性交互和博弈论
纳什均衡
协调与协商
合作与团队协作
分布式问题解决
机制设计与拍卖
智能体通信

Key theories

博弈论均衡分析: 博弈论将智能体建模为理性决策者，其收益取决于其他智能体的行动，而纳什均衡等均衡概念预测稳定的联合行为，为智能体之间的策略性交互提供了分析基础。
协调与合作: 信息有限且目标重叠的智能体必须进行协调以避免冲突，并进行合作以实现共同结果，这需要使用多智能体系统文献中研究的协议、协商和共享约定。
作为逆向博弈论的机制设计: 机制设计旨在设计交互规则，即使智能体出于自身利益行事，所产生的均衡也能实现设计者的目标，例如效率或真实行为。

Clinical relevance

多智能体技术应用于自动化交易和拍卖、电子市场、交通和网络路由、分布式传感器网络、机器人团队和蜂群、供应链以及在线平台的设计，凡是存在许多决策者互动且需要管理其激励和协调的场景。

History

多智能体系统起源于20世纪80年代的分布式人工智能，将智能体理论与博弈论和经济学相结合。20世纪90年代和21世纪初，智能体架构、通信标准和博弈论基础得到了巩固，如Wooldridge (2009) 和 Shoham 和 Leyton-Brown (2009) 的著作所述，其中机制设计和拍卖成为一个主要的实际应用方向。

Key figures

Michael Wooldridge
Yoav Shoham
Kevin Leyton-Brown
Nicholas R. Jennings
Katia Sycara

Seminal works

shoham2009
wooldridge2009
jennings1998

Frequently asked questions

多智能体系统与单个智能体有何不同？: 单个智能体推理并行动以在环境中实现自身目标。在多智能体系统中，多个自主智能体同时行动，因此每个智能体的最佳选择取决于其他智能体的行为。这引入了单个智能体AI不面临的策略性交互、协调和激励问题。
为什么博弈论对多智能体系统至关重要？: 由于多智能体系统中的结果取决于自利智能体的联合行动，博弈论提供了预测稳定行为（均衡）和设计交互的工具。它使研究人员能够以原则性的方式推理竞争、合作和激励。