Теория принятия решений и полезность
Теория принятия решений объединяет вероятности исходов с числовой полезностью этих исходов для определения и вычисления рационального выбора как максимизации ожидаемой полезности.
Definition
Теория принятия решений изучает, как агент с вероятностными убеждениями и предпочтениями, закодированными как полезности, должен выбирать между действиями; нормативный ответ заключается в выборе действия с наивысшей ожидаемой полезностью.
Scope
Эта тема охватывает основы принятия решений в условиях неопределенности: теорию полезности и аксиомы, которые обосновывают представление предпочтений функцией полезности, принцип максимальной ожидаемой полезности, сети принятия решений (диаграммы влияния), которые объединяют узлы случайности, решения и полезности, а также ценность информации, которая количественно определяет, насколько ценно наблюдение. В ней рассматривается, как формулируются и решаются рациональные единичные решения. Последовательное принятие решений во времени рассматривается в рамках марковских процессов принятия решений, а стратегическое взаимодействие между агентами — в рамках многоагентных систем.
Core questions
- Как рациональные предпочтения могут быть представлены числовой функцией полезности?
- Почему рациональный агент должен максимизировать ожидаемую полезность?
- Как сети принятия решений (диаграммы влияния) представляют и решают проблему принятия решений?
- Как вычисляется ценность получения дополнительной информации?
Key concepts
- функция полезности
- предпочтения и лотереи
- аксиомы рациональности
- максимальная ожидаемая полезность
- сети принятия решений (диаграммы влияния)
- узлы случайности, решения и полезности
- ценность информации
- отношение к риску
Key theories
- Теория ожидаемой полезности
- При наличии набора аксиом рациональности для предпочтений в отношении неопределенных перспектив существует функция полезности, такая что предпочтительный выбор всегда имеет наивысшую ожидаемую полезность, что дает нормативное обоснование для принятия решений в условиях неопределенности.
- Сети принятия решений (диаграммы влияния)
- Диаграммы влияния расширяют байесовские сети узлами решений и узлом полезности, предоставляя компактное графическое представление проблемы принятия решений, оптимальная политика для которой может быть вычислена с помощью вероятностного вывода и максимизации ожидаемой полезности.
- Ценность информации
- Теория ценности информации количественно определяет, сколько агент должен быть готов заплатить, чтобы наблюдать неопределенную величину перед принятием решения, сравнивая ожидаемую полезность с наблюдением и без него, что помогает определить, когда следует собирать больше доказательств.
Clinical relevance
Теоретико-решенческие методы поддерживают медицинский и клинический анализ решений, автоматизированное планирование сбора информации, рекомендательные и ценовые системы, а также разработку рациональных автономных агентов, явно показывая, как неопределенные убеждения и предпочтения объединяются в обоснованные выборы.
History
Теория ожидаемой полезности была аксиоматизирована фон Нейманом и Моргенштерном (1944) и получила субъективно-вероятностное обоснование Сэвиджем (1954). Теория ценности информации Говарда (1966) и последующая разработка диаграмм влияния привнесли теорию принятия решений в ИИ как практическую основу для создания рациональных агентов, принимающих решения.
Key figures
- John von Neumann
- Oskar Morgenstern
- Leonard J. Savage
- Ronald A. Howard
- Ross D. Shachter
Related topics
Seminal works
- vonneumann1944
- savage1954
- howard1966
Frequently asked questions
- Что такое принцип максимальной ожидаемой полезности?
- Он утверждает, что рациональный агент, сталкивающийся с неопределенностью, должен выбрать действие, чья средневзвешенная по вероятности полезность по возможным исходам является наивысшей. Согласно стандартным аксиомам о предпочтениях, этот принцип однозначно характеризует рациональный выбор.
- Что такое ценность информации?
- Ценность информации — это то, насколько улучшится ожидаемая полезность агента, если он сможет наблюдать некоторую неопределенную величину перед принятием решения. Она указывает рациональному агенту, когда сбор дополнительных доказательств оправдан, а когда он не изменит наилучшее действие настолько, чтобы оправдать затраты.