Programmazione Dinamica Bayesiana — Ottimizzazione sequenziale delle decisioni con aggiornamento bayesiano delle credenze
La Programmazione Dinamica Bayesiana (BDP) combina il framework di programmazione dinamica di Bellman con l'inferenza bayesiana per ottimizzare le decisioni sequenziali quando le probabilità di transizione o le strutture di ricompensa sono sconosciute. Ad ogni stadio, l'agente aggiorna le credenze sull'ambiente utilizzando i risultati osservati, quindi calcola una politica ottimale che tiene esplicitamente conto sia delle ricompense immediate sia del valore delle informazioni acquisite tramite l'esplorazione.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
Fonti
- Bertsekas, D. P. (1995). Dynamic Programming and Optimal Control. Athena Scientific, Belmont, MA. ISBN: 9781886529267
- Duff, M. O. (2002). Optimal Learning: Computational procedures for Bayes-adaptive Markov decision processes. PhD Dissertation, University of Massachusetts Amherst. link ↗
Come citare questa pagina
ScholarGate. (2026, June 3). Bayesian Dynamic Programming — Sequential decision optimization under uncertainty with Bayesian belief updating. ScholarGate. https://scholargate.app/it/simulation/bayesian-dynamic-programming
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Modello Markoviano BayesianoSimulazione↔ compare
- Programmazione DinamicaOttimizzazione↔ compare
- Apprendimento per rinforzoApprendimento profondo↔ compare
- Programmazione Dinamica StocasticaSimulazione↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →