不确定性推理
不确定性推理是人工智能的一个分支,它利用概率论和决策理论,在知识不完整、有噪声或只能部分观察到的情况下,得出结论并做出决策。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
不确定性推理将智能体不完整的知识表示为概率分布,并通过概率定律和预期效用最大化来计算应该相信什么以及如何行动。
Scope
该领域涵盖了用概率表示不确定知识的方法,以及在此基础上进行推理和决策的方法:例如贝叶斯网络等概率图模型、精确和近似概率推理、结合概率和效用的决策理论,以及通过马尔可夫决策过程进行的序贯决策。它探讨了信念度如何随证据更新以及如何计算理性选择。这些模型的数据驱动估计和策略的强化学习属于机器学习子领域;本领域侧重于表示、推理和决策原则。
Sub-topics
Core questions
- 当新证据出现时,信念度如何表示和更新?
- 如何利用条件独立性紧凑地表示大型联合分布?
- 在概率模型中,如何精确或近似地计算查询的概率?
- 如何将概率与偏好结合起来,以选择使预期效用最大化的行动?
Key concepts
- 概率作为信念度
- 贝叶斯法则
- 条件独立性
- 贝叶斯网络
- 精确和近似推理
- 效用和预期效用
- 决策理论
- 马尔可夫决策过程
Key theories
- 贝叶斯更新
- 贝叶斯法则规定了在给定证据的情况下,先验信念度如何修正为后验信念度,为概率推理以及将背景知识与观察结果相结合提供了规范基础。
- 图模型和条件独立性
- 贝叶斯网络和马尔可夫网络利用条件独立性将联合分布分解为局部组件,使得对于原本呈指数级增长的问题,表示和推理都变得可行。
- 最大预期效用
- 决策理论认为,理性智能体应选择使预期效用最大化的行动,将概率信念与对结果的偏好统一起来,并通过马尔可夫决策过程扩展到序贯决策。
Clinical relevance
概率推理是医学诊断系统、故障诊断和传感器融合、语音和语言处理、机器人技术和定位、风险分析以及推荐和决策支持系统的基础,适用于必须从不完整或有噪声的信息中得出结论和做出选择的任何场景。
History
早期人工智能对概率持怀疑态度,倾向于使用临时(ad hoc)的确定性因子,但珀尔(Pearl)在20世纪80年代的工作,最终体现在他1988年的著作中,表明贝叶斯网络使概率推理既有充分的理论基础又在计算上可行。决策理论和图模型方法,在科勒(Koller)和弗里德曼(Friedman)2009年的著作等中得到巩固,成为现代人工智能的核心。
Debates
- 概率与其他不确定性形式化方法之争
- 历史上,人工智能领域曾争论是使用概率还是使用确定性因子、模糊逻辑或德姆斯特-沙弗(Dempster-Shafer)信念函数等替代方法来建模不确定性;概率的、决策理论的观点之所以占据主导地位,很大程度上是因为其坚实的基础以及图模型所带来的可处理性。
Key figures
- Judea Pearl
- Daphne Koller
- Nir Friedman
- Ross D. Shachter
- Thomas Bayes
Related topics
Seminal works
- pearl1986
- pearl1988
- koller2009
Frequently asked questions
- 为什么对不确定知识使用概率而不是逻辑?
- 严格的逻辑要求陈述非真即假,这在知识不完整或证据不充分时显得笨拙。概率表示分级的信念度,并提供有原则的规则(例如贝叶斯法则)来根据证据更新这些信念度,使其非常适合不确定性推理。
- 贝叶斯网络对该领域的重要性体现在哪里?
- 一个包含许多变量的完整联合分布规模巨大,但贝叶斯网络利用条件独立性将其紧凑地表示为具有局部条件分布的图。这使得存储模型和计算概率查询都变得可行,因此它们是不确定性推理的基石。