برنامهریزی پویا تصادفی — تصمیمگیری متوالی در شرایط عدم قطعیت
برنامهریزی پویا تصادفی (SDP) یک چارچوب بهینهسازی ریاضی برای مسائل تصمیمگیری متوالی است که در آن نتایج تا حدی تصادفی هستند. این روش، اصل بهینگی بلمن را به محیطهای تصادفی گسترش میدهد و مسائل را به عنوان فرآیندهای تصمیمگیری مارکوف (MDPs) نمایش میدهد و سیاستهای بهینه را با حل معادلات بازگشتی ارزش بر روی حالتها و دورههای زمانی محاسبه میکند.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
+5 more
منابع
- Bellman, R. (1957). Dynamic Programming. Princeton University Press, Princeton, NJ. ISBN: 9780486428093
- Puterman, M. L. (1994). Markov Decision Processes: Discrete Stochastic Dynamic Programming. John Wiley & Sons, New York. ISBN: 9780471619772
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Stochastic Dynamic Programming (SDP) — Sequential decision-making under uncertainty via Markov decision processes. ScholarGate. https://scholargate.app/fa/simulation/stochastic-dynamic-programming
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- برنامهریزی پویابهینهسازی↔ compare
- مدل مارکوفشبیهسازی↔ compare
- شبیهسازی مونت کارلوتصمیمگیری↔ compare
- برنامهریزی خطی تصادفیشبیهسازی↔ compare
- برنامهریزی عدد صحیح مختلط تصادفیشبیهسازی↔ compare
- بهینهسازی تصادفی چندهدفهشبیهسازی↔ compare
ارجاعشده در
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →