Process / pipelineSimulation / optimization

Lập trình động theo kịch bản chính sách — Đánh giá chính sách tuần tự thông qua tối ưu Bellman trên các trạng thái tương lai rời rạc

Lập trình động theo kịch bản chính sách (PSDP) áp dụng khuôn khổ tối ưu hóa đệ quy của Bellman cho một tập hợp các kịch bản chính sách được xác định trước, cho phép người ra quyết định so sánh các quyết định theo giai đoạn, tuần tự trong các điều kiện tương lai khác nhau. Phương pháp này phân tách một lựa chọn chính sách phức tạp, đa kỳ thành các bài toán con dễ quản lý hơn, được giải ngược thời gian, mang lại chuỗi hành động tối ưu cho mỗi kịch bản và một cơ sở có cấu trúc để so sánh các kịch bản.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Bellman, R. (1957). Dynamic Programming. Princeton University Press, Princeton, NJ. ISBN: 9780691079516
  2. Puterman, M. L. (1994). Markov Decision Processes: Discrete Stochastic Dynamic Programming. John Wiley & Sons, New York. ISBN: 9780471619772

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Policy Scenario Dynamic Programming — Sequential policy evaluation via Bellman optimality across discrete future states. ScholarGate. https://scholargate.app/vi/simulation/policy-scenario-dynamic-programming

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGatePolicy Scenario Dynamic Programming (Policy Scenario Dynamic Programming — Sequential policy evaluation via Bellman optimality across discrete future states). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/simulation/policy-scenario-dynamic-programming · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026