ScholarGate
助手

多智能体系统

多智能体系统研究多个自主、交互的智能体——每个智能体都有自己的信息、目标和决策——如何协调、合作或竞争以实现个体或集体的结果。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

多智能体系统是由多个自主智能体组成的系统,这些智能体在共享环境中进行交互,每个智能体感知、决策和行动,其结果共同取决于智能体的选择。

Scope

该领域涵盖由许多交互智能体组成的系统及其交互的原则:战略行为和均衡的博弈论分析、智能体之间的协调与合作、分布式问题解决和约束满足,以及用于设计具有理想属性的交互的机制设计。它将智能体视为决策者,其选择相互影响。单个智能体的内部决策理论机制属于不确定性推理范畴,而交互学习则属于机器学习子领域。

Sub-topics

Core questions

  • 自利智能体如何进行策略性行为,以及会产生哪些稳定的结果(均衡)?
  • 智能体如何协调其行动并为共享或兼容的目标进行合作?
  • 如何通过将问题分配给多个具有部分信息的智能体来解决问题?
  • 如何设计交互规则,以使系统范围内的理想结果得以实现?

Key concepts

  • 自主智能体
  • 策略性交互和博弈论
  • 纳什均衡
  • 协调与协商
  • 合作与团队协作
  • 分布式问题解决
  • 机制设计与拍卖
  • 智能体通信

Key theories

博弈论均衡分析
博弈论将智能体建模为理性决策者,其收益取决于其他智能体的行动,而纳什均衡等均衡概念预测稳定的联合行为,为智能体之间的策略性交互提供了分析基础。
协调与合作
信息有限且目标重叠的智能体必须进行协调以避免冲突,并进行合作以实现共同结果,这需要使用多智能体系统文献中研究的协议、协商和共享约定。
作为逆向博弈论的机制设计
机制设计旨在设计交互规则,即使智能体出于自身利益行事,所产生的均衡也能实现设计者的目标,例如效率或真实行为。

Clinical relevance

多智能体技术应用于自动化交易和拍卖、电子市场、交通和网络路由、分布式传感器网络、机器人团队和蜂群、供应链以及在线平台的设计,凡是存在许多决策者互动且需要管理其激励和协调的场景。

History

多智能体系统起源于20世纪80年代的分布式人工智能,将智能体理论与博弈论和经济学相结合。20世纪90年代和21世纪初,智能体架构、通信标准和博弈论基础得到了巩固,如Wooldridge (2009) 和 Shoham 和 Leyton-Brown (2009) 的著作所述,其中机制设计和拍卖成为一个主要的实际应用方向。

Key figures

  • Michael Wooldridge
  • Yoav Shoham
  • Kevin Leyton-Brown
  • Nicholas R. Jennings
  • Katia Sycara

Related topics

Seminal works

  • shoham2009
  • wooldridge2009
  • jennings1998

Frequently asked questions

多智能体系统与单个智能体有何不同?
单个智能体推理并行动以在环境中实现自身目标。在多智能体系统中,多个自主智能体同时行动,因此每个智能体的最佳选择取决于其他智能体的行为。这引入了单个智能体AI不面临的策略性交互、协调和激励问题。
为什么博弈论对多智能体系统至关重要?
由于多智能体系统中的结果取决于自利智能体的联合行动,博弈论提供了预测稳定行为(均衡)和设计交互的工具。它使研究人员能够以原则性的方式推理竞争、合作和激励。

Methods for this concept

Related concepts