ScholarGate
Assistent
Process / pipelineSimulation / optimization

Bayesi dünaamiline programmeerimine — järjestikune otsuste optimeerimine Bayesi uskumuste uuendamisega

Bayesi dünaamiline programmeerimine (BDP) ühendab Bellmani dünaamilise programmeerimise raamistiku Bayesi järeldamisega, et optimeerida järjestikuseid otsuseid olukordades, kus ülemineku tõenäosused või tasustruktuurid on teadmata. Igas etapis uuendab agent oma uskumusi keskkonna kohta, kasutades vaadeldud tulemusi, seejärel arvutab optimaalse poliitika, mis arvestab nii vahetuid tasusid kui ka uurimise kaudu saadud informatsiooni väärtust.

Ava rakenduses MethodMindPeagiVideoPeagiDownload slides

Loe meetodi täielikku kirjeldust

Ainult liikmetele

Selle osa lugemiseks logi sisse tasuta kontoga.

Logi sisse

Method map

The neighbourhood of related methods — select a node to explore.

Allikad

  1. Bertsekas, D. P. (1995). Dynamic Programming and Optimal Control. Athena Scientific, Belmont, MA. ISBN: 9781886529267
  2. Duff, M. O. (2002). Optimal Learning: Computational procedures for Bayes-adaptive Markov decision processes. PhD Dissertation, University of Massachusetts Amherst. link

Kuidas sellele lehele viidata

ScholarGate. (2026, June 3). Bayesian Dynamic Programming — Sequential decision optimization under uncertainty with Bayesian belief updating. ScholarGate. https://scholargate.app/et/simulation/bayesian-dynamic-programming

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Sellele viitavad

ScholarGateBayesian Dynamic Programming (Bayesian Dynamic Programming — Sequential decision optimization under uncertainty with Bayesian belief updating). Loetud 2026-06-15 aadressilt https://scholargate.app/et/simulation/bayesian-dynamic-programming · Andmestik: https://doi.org/10.5281/zenodo.20539026