ScholarGate
Assistente
Machine learning

Apprendimento per Rinforzo Profondo

L'Apprendimento per Rinforzo Profondo (Deep Reinforcement Learning) combina le reti neurali con l'apprendimento per rinforzo, permettendo a un agente di imparare interagendo con un ambiente. È stato reso popolare dal lavoro del 2015 su Nature di Mnih e colleghi sul controllo di Atari a livello umano. Invece di imparare da un dataset etichettato fisso, l'agente compie azioni, osserva le ricompense e modella gradualmente una politica che massimizza il ritorno a lungo termine.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Fonti

  1. Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236
  2. Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link

Come citare questa pagina

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/it/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateDeep Reinforcement Learning (Deep Reinforcement Learning (DQN / PPO / A3C)). Consultato il 2026-06-15 da https://scholargate.app/it/deep-learning/deep-reinforcement-learning · Insieme di dati: https://doi.org/10.5281/zenodo.20539026