결정 이론 및 효용
결정 이론은 결과의 확률과 해당 결과에 대한 수치적 효용을 결합하여 기대 효용의 극대화로서 합리적인 선택을 정의하고 계산합니다.
PaperMind(으)로 주제 찾기곧 제공Find papers & topics
Tools & resources
Learn & explore
동영상곧 제공
Definition
결정 이론은 확률적 신념과 효용으로 인코딩된 선호를 가진 에이전트가 행동 중에서 어떻게 선택해야 하는지를 연구합니다. 규범적인 답변은 가장 높은 기대 효용을 가진 행동을 선택하는 것입니다.
Scope
이 주제는 불확실성 하에서의 의사 결정의 기초를 다룹니다: 효용 이론과 선호를 효용 함수로 나타내는 것을 정당화하는 공리, 최대 기대 효용 원칙, 확률, 결정 및 효용 노드를 결합하는 결정 네트워크(영향 다이어그램), 그리고 관찰의 가치를 정량화하는 정보의 가치. 이는 합리적인 단일 결정이 어떻게 구성되고 해결되는지를 다룹니다. 시간에 따른 순차적 의사 결정은 마르코프 결정 과정에서 다루어지며, 다중 에이전트 시스템에서는 에이전트 간의 전략적 상호 작용이 다루어집니다.
Core questions
- 합리적인 선호는 어떻게 수치적 효용 함수로 표현될 수 있는가?
- 합리적인 에이전트는 왜 기대 효용을 극대화해야 하는가?
- 결정 네트워크(영향 다이어그램)는 결정 문제를 어떻게 표현하고 해결하는가?
- 추가 정보를 획득하는 가치는 어떻게 계산되는가?
Key concepts
- 효용 함수
- 선호와 복권
- 합리성 공리
- 최대 기대 효용
- 결정 네트워크(영향 다이어그램)
- 확률, 결정 및 효용 노드
- 정보의 가치
- 위험 태도
Key theories
- 기대 효용 이론
- 불확실한 전망에 대한 선호에 대한 일련의 합리성 공리 하에서, 선호되는 선택이 항상 가장 높은 기대 효용을 가진 선택이 되도록 하는 효용 함수가 존재하며, 이는 불확실성 하에서의 의사 결정에 대한 규범적 기반을 제공합니다.
- 결정 네트워크(영향 다이어그램)
- 영향 다이어그램은 베이즈 네트워크를 결정 노드와 효용 노드로 확장하여, 최적 정책이 확률적 추론과 기대 효용 극대화를 통해 계산될 수 있는 결정 문제의 압축된 그래픽 표현을 제공합니다.
- 정보의 가치
- 정보 가치 이론은 에이전트가 결정하기 전에 불확실한 양을 관찰하기 위해 기꺼이 지불할 의사가 있는 금액을 정량화하며, 관찰 유무에 따른 기대 효용을 비교하여 언제 더 많은 증거를 수집해야 하는지를 안내합니다.
Clinical relevance
결정 이론적 방법은 불확실한 신념과 선호가 어떻게 정당화된 선택으로 결합되는지를 명시함으로써 의료 및 임상 의사 결정 분석, 정보 수집의 자동화된 계획, 추천 및 가격 책정 시스템, 그리고 합리적인 자율 에이전트의 설계를 지원합니다.
History
기대 효용 이론은 폰 노이만과 모르겐슈테른(1944)에 의해 공리화되었고, 새비지(1954)에 의해 주관적 확률 기반이 제공되었습니다. 하워드의 정보 가치 이론(1966)과 이후의 영향 다이어그램 개발은 결정 이론을 합리적인 의사 결정 에이전트를 구축하기 위한 실용적인 프레임워크로서 AI에 도입했습니다.
Key figures
- John von Neumann
- Oskar Morgenstern
- Leonard J. Savage
- Ronald A. Howard
- Ross D. Shachter
Related topics
Seminal works
- vonneumann1944
- savage1954
- howard1966
Frequently asked questions
- 최대 기대 효용 원칙이란 무엇인가?
- 이는 불확실성에 직면한 합리적인 에이전트가 가능한 결과에 대한 확률 가중 평균 효용이 가장 높은 행동을 선택해야 한다고 명시합니다. 선호에 대한 표준 공리 하에서 이 원칙은 합리적인 선택을 고유하게 특징짓습니다.
- 정보의 가치란 무엇인가?
- 정보의 가치는 에이전트가 결정하기 전에 불확실한 양을 관찰할 수 있다면 기대 효용이 얼마나 향상될 것인지를 나타냅니다. 이는 합리적인 에이전트에게 언제 더 많은 증거를 수집하는 것이 가치 있고, 언제 비용을 정당화할 만큼 최선의 행동을 바꾸지 않을 것인지를 알려줍니다.