Quy hoạch động ngẫu nhiên — Ra quyết định tuần tự trong điều kiện không chắc chắn
Quy hoạch động ngẫu nhiên (Stochastic Dynamic Programming – SDP) là một khuôn khổ tối ưu hóa toán học cho các bài toán ra quyết định tuần tự trong đó các kết quả một phần là ngẫu nhiên. Nó mở rộng nguyên lý tối ưu của Bellman cho các môi trường ngẫu nhiên, biểu diễn các bài toán dưới dạng các quá trình quyết định Markov (Markov Decision Processes – MDP) và tính toán các chính sách tối ưu bằng cách giải các phương trình giá trị đệ quy trên các trạng thái và khoảng thời gian.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
+5 more
Nguồn tài liệu
- Bellman, R. (1957). Dynamic Programming. Princeton University Press, Princeton, NJ. ISBN: 9780486428093
- Puterman, M. L. (1994). Markov Decision Processes: Discrete Stochastic Dynamic Programming. John Wiley & Sons, New York. ISBN: 9780471619772
Cách trích dẫn trang này
ScholarGate. (2026, June 3). Stochastic Dynamic Programming (SDP) — Sequential decision-making under uncertainty via Markov decision processes. ScholarGate. https://scholargate.app/vi/simulation/stochastic-dynamic-programming
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Lập trình độngTối ưu hóa↔ compare
- Mô hình MarkovMô phỏng↔ compare
- Mô phỏng Monte CarloRa quyết định↔ compare
- Quy hoạch tuyến tính ngẫu nhiênMô phỏng↔ compare
- Quy hoạch nguyên hỗn hợp ngẫu nhiênMô phỏng↔ compare
- Tối ưu hóa Đa mục tiêu Ngẫu nhiênMô phỏng↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →