最大期待効用の原理とは何ですか？

これは、不確実性に直面する合理的なエージェントは、可能な結果に対する確率加重平均効用が最も高い行動を選択すべきであると述べています。選好に関する標準的な公理の下では、この原理は合理的な選択を一意に特徴づけます。

情報の価値とは何ですか？

情報の価値とは、エージェントが決定を下す前に不確実な量を観測できた場合に、その期待効用がどれだけ改善されるかを示すものです。これは、合理的なエージェントにとって、いつより多くの証拠を収集する価値があるのか、そしていつそれが最善の行動を変えるほどではないためコストを正当化しないのかを教えてくれます。

決定理論と効用

決定理論は、結果の確率とそれらの結果に対する数値的な効用を組み合わせることで、期待効用の最大化として合理的な選択を定義し、計算します。

PaperMindでテーマを探す近日公開Find papers & topics

Tools & resources

スライドをダウンロード

Learn & explore

動画近日公開

Definition

決定理論は、確率的信念と効用として符号化された選好を持つエージェントが、行動の中からどのように選択すべきかを研究します。規範的な答えは、最も高い期待効用を持つ行動を選択することです。

Scope

このトピックでは、不確実性下での意思決定の基礎について扱います。具体的には、効用理論と、選好を効用関数で表現することを正当化する公理、最大期待効用の原理、確率、決定、効用ノードを組み合わせた決定ネットワーク（影響図）、および観測の価値を定量化する情報の価値についてです。合理的な単一の決定がどのように組み立てられ、解決されるかについて説明します。時間経過に伴う逐次的な意思決定はマルコフ決定過程で、エージェント間の戦略的相互作用はマルチエージェントシステムで扱われます。

Core questions

合理的な選好はどのように数値的な効用関数で表現できるのでしょうか？
なぜ合理的なエージェントは期待効用を最大化すべきなのでしょうか？
決定ネットワーク（影響図）はどのように決定問題を表現し、解決するのでしょうか？
追加情報を取得する価値はどのように計算されるのでしょうか？

Key concepts

効用関数
選好とくじ
合理性の公理
最大期待効用
決定ネットワーク（影響図）
確率、決定、効用ノード
情報の価値
リスク態度

Key theories

期待効用理論: 不確実な見込みに対する選好に関する一連の合理性の公理の下で、選好される選択肢が常に最も高い期待効用を持つ選択肢となるような効用関数が存在し、不確実性下での意思決定に規範的な基礎を与えます。
決定ネットワーク（影響図）: 影響図は、ベイジアンネットワークを決定ノードと効用ノードで拡張したものであり、決定問題のコンパクトなグラフィカル表現を提供します。その最適な方策は、確率的推論と期待効用最大化によって計算できます。
情報の価値: 情報価値理論は、エージェントが決定を下す前に不確実な量を観測するためにどれだけの金額を支払うべきかを定量化します。これは、観測の有無による期待効用を比較することで、いつより多くの証拠を収集すべきかを導きます。

Clinical relevance

決定理論的手法は、不確実な信念と選好がどのように組み合わされて正当な選択となるかを明確にすることで、医療および臨床意思決定分析、情報収集の自動計画、推奨および価格設定システム、合理的な自律エージェントの設計を支援します。

History

期待効用理論は、フォン・ノイマンとモルゲンシュテルン（1944年）によって公理化され、サベージ（1954年）によって主観的確率の基礎が与えられました。ハワードの情報価値理論（1966年）と、その後の影響図の発展により、決定理論は合理的な意思決定エージェントを構築するための実用的なフレームワークとしてAIに導入されました。

Key figures

John von Neumann
Oskar Morgenstern
Leonard J. Savage
Ronald A. Howard
Ross D. Shachter

Seminal works

vonneumann1944
savage1954
howard1966

Frequently asked questions

最大期待効用の原理とは何ですか？: これは、不確実性に直面する合理的なエージェントは、可能な結果に対する確率加重平均効用が最も高い行動を選択すべきであると述べています。選好に関する標準的な公理の下では、この原理は合理的な選択を一意に特徴づけます。
情報の価値とは何ですか？: 情報の価値とは、エージェントが決定を下す前に不確実な量を観測できた場合に、その期待効用がどれだけ改善されるかを示すものです。これは、合理的なエージェントにとって、いつより多くの証拠を収集する価値があるのか、そしていつそれが最善の行動を変えるほどではないためコストを正当化しないのかを教えてくれます。