ScholarGate
Trợ lý

Lý thuyết Quyết định và Hàm lợi ích

Lý thuyết quyết định kết hợp xác suất của các kết quả với một hàm lợi ích số hóa trên các kết quả đó để định nghĩa và tính toán lựa chọn hợp lý như là việc tối đa hóa lợi ích kỳ vọng.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics
Tools & resources
Tải xuống bản trình chiếu
Learn & explore
VideoSắp ra mắt

Definition

Lý thuyết quyết định nghiên cứu cách một tác nhân với các niềm tin xác suất và các ưu tiên được mã hóa dưới dạng hàm lợi ích nên lựa chọn giữa các hành động; câu trả lời chuẩn tắc là chọn hành động có lợi ích kỳ vọng cao nhất.

Scope

Chủ đề này bao gồm các nền tảng của việc ra quyết định trong điều kiện không chắc chắn: lý thuyết hàm lợi ích và các tiên đề biện minh cho việc biểu diễn các ưu tiên bằng một hàm lợi ích, nguyên tắc tối đa hóa lợi ích kỳ vọng, mạng lưới quyết định (sơ đồ ảnh hưởng) kết hợp các nút ngẫu nhiên, quyết định và lợi ích, và giá trị thông tin định lượng mức độ đáng giá của một quan sát. Nó đề cập đến cách các quyết định đơn lẻ hợp lý được xây dựng và giải quyết. Việc ra quyết định tuần tự theo thời gian được xử lý trong các quy trình quyết định Markov, và tương tác chiến lược giữa các tác nhân trong các hệ thống đa tác nhân.

Core questions

  • Làm thế nào các ưu tiên hợp lý có thể được biểu diễn bằng một hàm lợi ích số hóa?
  • Tại sao một tác nhân hợp lý nên tối đa hóa lợi ích kỳ vọng?
  • Mạng lưới quyết định (sơ đồ ảnh hưởng) biểu diễn và giải quyết một vấn đề quyết định như thế nào?
  • Giá trị của việc thu thập thông tin bổ sung được tính toán như thế nào?

Key concepts

  • hàm lợi ích
  • ưu tiên và xổ số
  • các tiên đề hợp lý
  • lợi ích kỳ vọng tối đa
  • mạng lưới quyết định (sơ đồ ảnh hưởng)
  • các nút ngẫu nhiên, quyết định và lợi ích
  • giá trị thông tin
  • thái độ rủi ro

Key theories

Lý thuyết lợi ích kỳ vọng
Theo một tập hợp các tiên đề hợp lý về các ưu tiên đối với các triển vọng không chắc chắn, tồn tại một hàm lợi ích sao cho lựa chọn ưu tiên luôn là lựa chọn có lợi ích kỳ vọng cao nhất, cung cấp một nền tảng chuẩn tắc cho việc ra quyết định trong điều kiện không chắc chắn.
Mạng lưới quyết định (sơ đồ ảnh hưởng)
Sơ đồ ảnh hưởng mở rộng mạng lưới Bayes với các nút quyết định và một nút lợi ích, cung cấp một biểu diễn đồ họa nhỏ gọn của một vấn đề quyết định mà chính sách tối ưu của nó có thể được tính toán bằng suy luận xác suất và tối đa hóa lợi ích kỳ vọng.
Giá trị thông tin
Lý thuyết giá trị thông tin định lượng mức độ một tác nhân nên sẵn sàng trả tiền để quan sát một đại lượng không chắc chắn trước khi quyết định, bằng cách so sánh lợi ích kỳ vọng có và không có quan sát, hướng dẫn khi nào nên thu thập thêm bằng chứng.

Clinical relevance

Các phương pháp lý thuyết quyết định hỗ trợ phân tích quyết định y tế và lâm sàng, lập kế hoạch tự động thu thập thông tin, hệ thống khuyến nghị và định giá, và thiết kế các tác nhân tự trị hợp lý, bằng cách làm rõ cách các niềm tin không chắc chắn và các ưu tiên kết hợp thành các lựa chọn hợp lý.

History

Lý thuyết lợi ích kỳ vọng được tiên đề hóa bởi von Neumann và Morgenstern (1944) và được Savage (1954) đặt nền tảng xác suất chủ quan. Lý thuyết giá trị thông tin của Howard (1966) và sự phát triển sau này của sơ đồ ảnh hưởng đã đưa lý thuyết quyết định vào AI như một khuôn khổ thực tiễn để xây dựng các tác nhân ra quyết định hợp lý.

Key figures

  • John von Neumann
  • Oskar Morgenstern
  • Leonard J. Savage
  • Ronald A. Howard
  • Ross D. Shachter

Related topics

Seminal works

  • vonneumann1944
  • savage1954
  • howard1966

Frequently asked questions

Nguyên tắc tối đa hóa lợi ích kỳ vọng là gì?
Nó nói rằng một tác nhân hợp lý đối mặt với sự không chắc chắn nên chọn hành động có lợi ích trung bình có trọng số xác suất trên các kết quả có thể xảy ra là cao nhất. Theo các tiên đề tiêu chuẩn về các ưu tiên, nguyên tắc này đặc trưng duy nhất cho lựa chọn hợp lý.
Giá trị thông tin là gì?
Giá trị thông tin là mức độ lợi ích kỳ vọng của một tác nhân sẽ được cải thiện nếu nó có thể quan sát một đại lượng không chắc chắn nào đó trước khi quyết định. Nó cho một tác nhân hợp lý biết khi nào việc thu thập thêm bằng chứng là đáng giá và khi nào nó sẽ không thay đổi hành động tốt nhất đủ để biện minh cho chi phí.

Methods for this concept

Related concepts