Was ist das Prinzip des maximalen erwarteten Nutzens?

Es besagt, dass ein rationaler Agent, der Unsicherheit ausgesetzt ist, die Handlung wählen sollte, deren wahrscheinlichkeitsgewichteter durchschnittlicher Nutzen über mögliche Ergebnisse am höchsten ist. Unter Standardaxiomen für Präferenzen charakterisiert dieses Prinzip die rationale Wahl eindeutig.

Was ist der Informationswert?

Der Informationswert ist der Betrag, um den sich der erwartete Nutzen eines Agenten verbessern würde, wenn er eine unsichere Größe vor einer Entscheidung beobachten könnte. Er zeigt einem rationalen Agenten, wann das Sammeln weiterer Evidenz lohnenswert ist und wann es die beste Handlung nicht ausreichend ändern würde, um die Kosten zu rechtfertigen.

Entscheidungstheorie und Nutzen

Die Entscheidungstheorie kombiniert Wahrscheinlichkeiten von Ergebnissen mit einem numerischen Nutzen für diese Ergebnisse, um rationale Entscheidungen als Maximierung des erwarteten Nutzens zu definieren und zu berechnen.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Die Entscheidungstheorie untersucht, wie ein Agent mit probabilistischen Überzeugungen und Präferenzen, die als Nutzen kodiert sind, zwischen Handlungen wählen sollte; die normative Antwort ist, die Handlung mit dem höchsten erwarteten Nutzen zu wählen.

Scope

Dieses Thema behandelt die Grundlagen der Entscheidungsfindung unter Unsicherheit: die Nutzentheorie und die Axiome, die die Darstellung von Präferenzen durch eine Nutzenfunktion rechtfertigen, das Prinzip des maximalen erwarteten Nutzens, Entscheidungsnetzwerke (Einflussdiagramme), die Zufalls-, Entscheidungs- und Nutzenknoten kombinieren, sowie den Informationswert, der quantifiziert, wie viel eine Beobachtung wert ist. Es wird behandelt, wie rationale Einzelentscheidungen formuliert und gelöst werden. Sequentielle Entscheidungsfindung über die Zeit wird unter Markov-Entscheidungsprozessen behandelt, und strategische Interaktion zwischen Agenten unter Multi-Agenten-Systemen.

Core questions

Wie können rationale Präferenzen durch eine numerische Nutzenfunktion dargestellt werden?
Warum sollte ein rationaler Agent den erwarteten Nutzen maximieren?
Wie stellen Entscheidungsnetzwerke (Einflussdiagramme) ein Entscheidungsproblem dar und lösen es?
Wie wird der Wert der Beschaffung zusätzlicher Informationen berechnet?

Key concepts

Nutzenfunktion
Präferenzen und Lotterien
Rationalitätsaxiome
maximaler erwarteter Nutzen
Entscheidungsnetzwerke (Einflussdiagramme)
Zufalls-, Entscheidungs- und Nutzenknoten
Informationswert
Risikobereitschaft

Key theories

Theorie des erwarteten Nutzens: Unter einer Reihe von Rationalitätsaxiomen für Präferenzen über unsichere Aussichten existiert eine Nutzenfunktion, so dass die bevorzugte Wahl immer diejenige mit dem höchsten erwarteten Nutzen ist, was eine normative Grundlage für die Entscheidungsfindung unter Unsicherheit bietet.
Entscheidungsnetzwerke (Einflussdiagramme): Einflussdiagramme erweitern Bayes'sche Netze um Entscheidungsknoten und einen Nutzenknoten und bieten eine kompakte grafische Darstellung eines Entscheidungsproblems, dessen optimale Strategie durch probabilistische Inferenz und Maximierung des erwarteten Nutzens berechnet werden kann.
Informationswert: Die Informationswerttheorie quantifiziert, wie viel ein Agent bereit sein sollte zu zahlen, um eine unsichere Größe vor einer Entscheidung zu beobachten, indem sie den erwarteten Nutzen mit und ohne Beobachtung vergleicht und so leitet, wann weitere Evidenz gesammelt werden sollte.

Clinical relevance

Entscheidungstheoretische Methoden unterstützen die medizinische und klinische Entscheidungsanalyse, die automatisierte Planung der Informationsbeschaffung, Empfehlungs- und Preissysteme sowie das Design rationaler autonomer Agenten, indem sie explizit machen, wie unsichere Überzeugungen und Präferenzen zu gerechtfertigten Entscheidungen führen.

History

Die Theorie des erwarteten Nutzens wurde von von Neumann und Morgenstern (1944) axiomatisiert und von Savage (1954) auf eine subjektiv-probabilistische Grundlage gestellt. Howards Information Value Theory (1966) und die spätere Entwicklung von Einflussdiagrammen brachten die Entscheidungstheorie als praktischen Rahmen für den Aufbau rationaler Entscheidungsagenten in die KI.

Key figures

John von Neumann
Oskar Morgenstern
Leonard J. Savage
Ronald A. Howard
Ross D. Shachter

Seminal works

vonneumann1944
savage1954
howard1966

Frequently asked questions

Was ist das Prinzip des maximalen erwarteten Nutzens?: Es besagt, dass ein rationaler Agent, der Unsicherheit ausgesetzt ist, die Handlung wählen sollte, deren wahrscheinlichkeitsgewichteter durchschnittlicher Nutzen über mögliche Ergebnisse am höchsten ist. Unter Standardaxiomen für Präferenzen charakterisiert dieses Prinzip die rationale Wahl eindeutig.
Was ist der Informationswert?: Der Informationswert ist der Betrag, um den sich der erwartete Nutzen eines Agenten verbessern würde, wenn er eine unsichere Größe vor einer Entscheidung beobachten könnte. Er zeigt einem rationalen Agenten, wann das Sammeln weiterer Evidenz lohnenswert ist und wann es die beste Handlung nicht ausreichend ändern würde, um die Kosten zu rechtfertigen.