ScholarGate
Ассистент

Теория принятия решений и полезность

Теория принятия решений объединяет вероятности исходов с числовой полезностью этих исходов для определения и вычисления рационального выбора как максимизации ожидаемой полезности.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Теория принятия решений изучает, как агент с вероятностными убеждениями и предпочтениями, закодированными как полезности, должен выбирать между действиями; нормативный ответ заключается в выборе действия с наивысшей ожидаемой полезностью.

Scope

Эта тема охватывает основы принятия решений в условиях неопределенности: теорию полезности и аксиомы, которые обосновывают представление предпочтений функцией полезности, принцип максимальной ожидаемой полезности, сети принятия решений (диаграммы влияния), которые объединяют узлы случайности, решения и полезности, а также ценность информации, которая количественно определяет, насколько ценно наблюдение. В ней рассматривается, как формулируются и решаются рациональные единичные решения. Последовательное принятие решений во времени рассматривается в рамках марковских процессов принятия решений, а стратегическое взаимодействие между агентами — в рамках многоагентных систем.

Core questions

  • Как рациональные предпочтения могут быть представлены числовой функцией полезности?
  • Почему рациональный агент должен максимизировать ожидаемую полезность?
  • Как сети принятия решений (диаграммы влияния) представляют и решают проблему принятия решений?
  • Как вычисляется ценность получения дополнительной информации?

Key concepts

  • функция полезности
  • предпочтения и лотереи
  • аксиомы рациональности
  • максимальная ожидаемая полезность
  • сети принятия решений (диаграммы влияния)
  • узлы случайности, решения и полезности
  • ценность информации
  • отношение к риску

Key theories

Теория ожидаемой полезности
При наличии набора аксиом рациональности для предпочтений в отношении неопределенных перспектив существует функция полезности, такая что предпочтительный выбор всегда имеет наивысшую ожидаемую полезность, что дает нормативное обоснование для принятия решений в условиях неопределенности.
Сети принятия решений (диаграммы влияния)
Диаграммы влияния расширяют байесовские сети узлами решений и узлом полезности, предоставляя компактное графическое представление проблемы принятия решений, оптимальная политика для которой может быть вычислена с помощью вероятностного вывода и максимизации ожидаемой полезности.
Ценность информации
Теория ценности информации количественно определяет, сколько агент должен быть готов заплатить, чтобы наблюдать неопределенную величину перед принятием решения, сравнивая ожидаемую полезность с наблюдением и без него, что помогает определить, когда следует собирать больше доказательств.

Clinical relevance

Теоретико-решенческие методы поддерживают медицинский и клинический анализ решений, автоматизированное планирование сбора информации, рекомендательные и ценовые системы, а также разработку рациональных автономных агентов, явно показывая, как неопределенные убеждения и предпочтения объединяются в обоснованные выборы.

History

Теория ожидаемой полезности была аксиоматизирована фон Нейманом и Моргенштерном (1944) и получила субъективно-вероятностное обоснование Сэвиджем (1954). Теория ценности информации Говарда (1966) и последующая разработка диаграмм влияния привнесли теорию принятия решений в ИИ как практическую основу для создания рациональных агентов, принимающих решения.

Key figures

  • John von Neumann
  • Oskar Morgenstern
  • Leonard J. Savage
  • Ronald A. Howard
  • Ross D. Shachter

Related topics

Seminal works

  • vonneumann1944
  • savage1954
  • howard1966

Frequently asked questions

Что такое принцип максимальной ожидаемой полезности?
Он утверждает, что рациональный агент, сталкивающийся с неопределенностью, должен выбрать действие, чья средневзвешенная по вероятности полезность по возможным исходам является наивысшей. Согласно стандартным аксиомам о предпочтениях, этот принцип однозначно характеризует рациональный выбор.
Что такое ценность информации?
Ценность информации — это то, насколько улучшится ожидаемая полезность агента, если он сможет наблюдать некоторую неопределенную величину перед принятием решения. Она указывает рациональному агенту, когда сбор дополнительных доказательств оправдан, а когда он не изменит наилучшее действие настолько, чтобы оправдать затраты.

Methods for this concept

Related concepts