Entscheidungstheorie und Nutzen
Die Entscheidungstheorie kombiniert Wahrscheinlichkeiten von Ergebnissen mit einem numerischen Nutzen für diese Ergebnisse, um rationale Entscheidungen als Maximierung des erwarteten Nutzens zu definieren und zu berechnen.
Definition
Die Entscheidungstheorie untersucht, wie ein Agent mit probabilistischen Überzeugungen und Präferenzen, die als Nutzen kodiert sind, zwischen Handlungen wählen sollte; die normative Antwort ist, die Handlung mit dem höchsten erwarteten Nutzen zu wählen.
Scope
Dieses Thema behandelt die Grundlagen der Entscheidungsfindung unter Unsicherheit: die Nutzentheorie und die Axiome, die die Darstellung von Präferenzen durch eine Nutzenfunktion rechtfertigen, das Prinzip des maximalen erwarteten Nutzens, Entscheidungsnetzwerke (Einflussdiagramme), die Zufalls-, Entscheidungs- und Nutzenknoten kombinieren, sowie den Informationswert, der quantifiziert, wie viel eine Beobachtung wert ist. Es wird behandelt, wie rationale Einzelentscheidungen formuliert und gelöst werden. Sequentielle Entscheidungsfindung über die Zeit wird unter Markov-Entscheidungsprozessen behandelt, und strategische Interaktion zwischen Agenten unter Multi-Agenten-Systemen.
Core questions
- Wie können rationale Präferenzen durch eine numerische Nutzenfunktion dargestellt werden?
- Warum sollte ein rationaler Agent den erwarteten Nutzen maximieren?
- Wie stellen Entscheidungsnetzwerke (Einflussdiagramme) ein Entscheidungsproblem dar und lösen es?
- Wie wird der Wert der Beschaffung zusätzlicher Informationen berechnet?
Key concepts
- Nutzenfunktion
- Präferenzen und Lotterien
- Rationalitätsaxiome
- maximaler erwarteter Nutzen
- Entscheidungsnetzwerke (Einflussdiagramme)
- Zufalls-, Entscheidungs- und Nutzenknoten
- Informationswert
- Risikobereitschaft
Key theories
- Theorie des erwarteten Nutzens
- Unter einer Reihe von Rationalitätsaxiomen für Präferenzen über unsichere Aussichten existiert eine Nutzenfunktion, so dass die bevorzugte Wahl immer diejenige mit dem höchsten erwarteten Nutzen ist, was eine normative Grundlage für die Entscheidungsfindung unter Unsicherheit bietet.
- Entscheidungsnetzwerke (Einflussdiagramme)
- Einflussdiagramme erweitern Bayes'sche Netze um Entscheidungsknoten und einen Nutzenknoten und bieten eine kompakte grafische Darstellung eines Entscheidungsproblems, dessen optimale Strategie durch probabilistische Inferenz und Maximierung des erwarteten Nutzens berechnet werden kann.
- Informationswert
- Die Informationswerttheorie quantifiziert, wie viel ein Agent bereit sein sollte zu zahlen, um eine unsichere Größe vor einer Entscheidung zu beobachten, indem sie den erwarteten Nutzen mit und ohne Beobachtung vergleicht und so leitet, wann weitere Evidenz gesammelt werden sollte.
Clinical relevance
Entscheidungstheoretische Methoden unterstützen die medizinische und klinische Entscheidungsanalyse, die automatisierte Planung der Informationsbeschaffung, Empfehlungs- und Preissysteme sowie das Design rationaler autonomer Agenten, indem sie explizit machen, wie unsichere Überzeugungen und Präferenzen zu gerechtfertigten Entscheidungen führen.
History
Die Theorie des erwarteten Nutzens wurde von von Neumann und Morgenstern (1944) axiomatisiert und von Savage (1954) auf eine subjektiv-probabilistische Grundlage gestellt. Howards Information Value Theory (1966) und die spätere Entwicklung von Einflussdiagrammen brachten die Entscheidungstheorie als praktischen Rahmen für den Aufbau rationaler Entscheidungsagenten in die KI.
Key figures
- John von Neumann
- Oskar Morgenstern
- Leonard J. Savage
- Ronald A. Howard
- Ross D. Shachter
Related topics
Seminal works
- vonneumann1944
- savage1954
- howard1966
Frequently asked questions
- Was ist das Prinzip des maximalen erwarteten Nutzens?
- Es besagt, dass ein rationaler Agent, der Unsicherheit ausgesetzt ist, die Handlung wählen sollte, deren wahrscheinlichkeitsgewichteter durchschnittlicher Nutzen über mögliche Ergebnisse am höchsten ist. Unter Standardaxiomen für Präferenzen charakterisiert dieses Prinzip die rationale Wahl eindeutig.
- Was ist der Informationswert?
- Der Informationswert ist der Betrag, um den sich der erwartete Nutzen eines Agenten verbessern würde, wenn er eine unsichere Größe vor einer Entscheidung beobachten könnte. Er zeigt einem rationalen Agenten, wann das Sammeln weiterer Evidenz lohnenswert ist und wann es die beste Handlung nicht ausreichend ändern würde, um die Kosten zu rechtfertigen.