决策理论与效用
决策理论将结果的概率与这些结果的数值效用相结合,通过最大化预期效用,定义并计算理性选择。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
决策理论研究具有概率信念和编码为效用的偏好的代理应如何在行动中进行选择;规范性答案是选择具有最高预期效用的行动。
Scope
本主题涵盖不确定性下决策制定的基础:效用理论以及证明通过效用函数表示偏好的公理、最大预期效用原则、结合了机会、决策和效用节点的决策网络(影响图),以及量化观察价值的信息价值。它探讨了如何构建和解决理性的单一决策。随时间变化的序贯决策在马尔可夫决策过程中处理,而代理之间的战略互动则在多智能体系统中处理。
Core questions
- 理性偏好如何通过数值效用函数表示?
- 理性代理为何应最大化预期效用?
- 决策网络(影响图)如何表示和解决决策问题?
- 获取额外信息的价值如何计算?
Key concepts
- 效用函数
- 偏好与彩票
- 理性公理
- 最大预期效用
- 决策网络(影响图)
- 机会、决策和效用节点
- 信息价值
- 风险态度
Key theories
- 预期效用理论
- 在一组关于不确定前景偏好的理性公理下,存在一个效用函数,使得偏好的选择总是具有最高预期效用的选择,为不确定性下的决策制定提供了规范基础。
- 决策网络(影响图)
- 影响图通过决策节点和效用节点扩展了贝叶斯网络,提供了一种决策问题的紧凑图形表示,其最优策略可以通过概率推理和预期效用最大化来计算。
- 信息价值
- 信息价值理论通过比较有无观察时的预期效用,量化了代理在决策前愿意为观察不确定量支付多少,从而指导何时收集更多证据。
Clinical relevance
决策理论方法通过明确不确定信念和偏好如何结合成合理选择,支持医学和临床决策分析、信息收集的自动化规划、推荐和定价系统,以及理性自主代理的设计。
History
预期效用理论由冯·诺依曼和摩根斯坦(1944)公理化,并由萨维奇(1954)奠定了主观概率基础。霍华德的信息价值理论(1966)以及后来影响图的发展,使决策理论进入人工智能领域,成为构建理性决策代理的实用框架。
Key figures
- John von Neumann
- Oskar Morgenstern
- Leonard J. Savage
- Ronald A. Howard
- Ross D. Shachter
Related topics
Seminal works
- vonneumann1944
- savage1954
- howard1966
Frequently asked questions
- 最大预期效用原则是什么?
- 它指出,面对不确定性的理性代理应选择在可能结果上具有最高概率加权平均效用的行动。在标准偏好公理下,该原则独特地表征了理性选择。
- 信息价值是什么?
- 信息价值是指如果代理在决策前能够观察到某个不确定量,其预期效用会提高多少。它告诉理性代理何时收集更多证据是值得的,以及何时收集证据不会充分改变最佳行动以证明其成本。