Что такое принцип максимальной ожидаемой полезности?

Он утверждает, что рациональный агент, сталкивающийся с неопределенностью, должен выбрать действие, чья средневзвешенная по вероятности полезность по возможным исходам является наивысшей. Согласно стандартным аксиомам о предпочтениях, этот принцип однозначно характеризует рациональный выбор.

Что такое ценность информации?

Ценность информации — это то, насколько улучшится ожидаемая полезность агента, если он сможет наблюдать некоторую неопределенную величину перед принятием решения. Она указывает рациональному агенту, когда сбор дополнительных доказательств оправдан, а когда он не изменит наилучшее действие настолько, чтобы оправдать затраты.

Теория принятия решений и полезность

Теория принятия решений объединяет вероятности исходов с числовой полезностью этих исходов для определения и вычисления рационального выбора как максимизации ожидаемой полезности.

Найти тему в PaperMindСкороFind papers & topics

Tools & resources

Скачать слайды

Learn & explore

ВидеоСкоро

Definition

Теория принятия решений изучает, как агент с вероятностными убеждениями и предпочтениями, закодированными как полезности, должен выбирать между действиями; нормативный ответ заключается в выборе действия с наивысшей ожидаемой полезностью.

Scope

Эта тема охватывает основы принятия решений в условиях неопределенности: теорию полезности и аксиомы, которые обосновывают представление предпочтений функцией полезности, принцип максимальной ожидаемой полезности, сети принятия решений (диаграммы влияния), которые объединяют узлы случайности, решения и полезности, а также ценность информации, которая количественно определяет, насколько ценно наблюдение. В ней рассматривается, как формулируются и решаются рациональные единичные решения. Последовательное принятие решений во времени рассматривается в рамках марковских процессов принятия решений, а стратегическое взаимодействие между агентами — в рамках многоагентных систем.

Core questions

Как рациональные предпочтения могут быть представлены числовой функцией полезности?
Почему рациональный агент должен максимизировать ожидаемую полезность?
Как сети принятия решений (диаграммы влияния) представляют и решают проблему принятия решений?
Как вычисляется ценность получения дополнительной информации?

Key concepts

функция полезности
предпочтения и лотереи
аксиомы рациональности
максимальная ожидаемая полезность
сети принятия решений (диаграммы влияния)
узлы случайности, решения и полезности
ценность информации
отношение к риску

Key theories

Теория ожидаемой полезности: При наличии набора аксиом рациональности для предпочтений в отношении неопределенных перспектив существует функция полезности, такая что предпочтительный выбор всегда имеет наивысшую ожидаемую полезность, что дает нормативное обоснование для принятия решений в условиях неопределенности.
Сети принятия решений (диаграммы влияния): Диаграммы влияния расширяют байесовские сети узлами решений и узлом полезности, предоставляя компактное графическое представление проблемы принятия решений, оптимальная политика для которой может быть вычислена с помощью вероятностного вывода и максимизации ожидаемой полезности.
Ценность информации: Теория ценности информации количественно определяет, сколько агент должен быть готов заплатить, чтобы наблюдать неопределенную величину перед принятием решения, сравнивая ожидаемую полезность с наблюдением и без него, что помогает определить, когда следует собирать больше доказательств.

Clinical relevance

Теоретико-решенческие методы поддерживают медицинский и клинический анализ решений, автоматизированное планирование сбора информации, рекомендательные и ценовые системы, а также разработку рациональных автономных агентов, явно показывая, как неопределенные убеждения и предпочтения объединяются в обоснованные выборы.

History

Теория ожидаемой полезности была аксиоматизирована фон Нейманом и Моргенштерном (1944) и получила субъективно-вероятностное обоснование Сэвиджем (1954). Теория ценности информации Говарда (1966) и последующая разработка диаграмм влияния привнесли теорию принятия решений в ИИ как практическую основу для создания рациональных агентов, принимающих решения.

Key figures

John von Neumann
Oskar Morgenstern
Leonard J. Savage
Ronald A. Howard
Ross D. Shachter

Seminal works

vonneumann1944
savage1954
howard1966

Frequently asked questions

Что такое принцип максимальной ожидаемой полезности?: Он утверждает, что рациональный агент, сталкивающийся с неопределенностью, должен выбрать действие, чья средневзвешенная по вероятности полезность по возможным исходам является наивысшей. Согласно стандартным аксиомам о предпочтениях, этот принцип однозначно характеризует рациональный выбор.
Что такое ценность информации?: Ценность информации — это то, насколько улучшится ожидаемая полезность агента, если он сможет наблюдать некоторую неопределенную величину перед принятием решения. Она указывает рациональному агенту, когда сбор дополнительных доказательств оправдан, а когда он не изменит наилучшее действие настолько, чтобы оправдать затраты.