Machine learning

Apprendimento per Rinforzo Profondo

L'Apprendimento per Rinforzo Profondo (Deep Reinforcement Learning) combina le reti neurali con l'apprendimento per rinforzo, permettendo a un agente di imparare interagendo con un ambiente. È stato reso popolare dal lavoro del 2015 su Nature di Mnih e colleghi sul controllo di Atari a livello umano. Invece di imparare da un dataset etichettato fisso, l'agente compie azioni, osserva le ricompense e modella gradualmente una politica che massimizza il ritorno a lungo termine.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Apprendimento per Rinforzo Profondo

Ricerca Architetturale N…Random Forest Reti neurali ricorrenti XGBoost Differential Evolution Apprendimento per Rinfor…Programmazione Dinamica Metodi basati sul gradie…Q-Learning Modello generativo basat…

Fonti

Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗
Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link ↗

Come citare questa pagina

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/it/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Ricerca Architetturale NeuraleApprendimento profondo↔ compare
Random ForestApprendimento automatico↔ compare
Reti neurali ricorrentiApprendimento profondo↔ compare
XGBoostApprendimento automatico↔ compare

Compare side by side →

Citato da

Differential Evolution Apprendimento per Rinforzo Adattivo al Dominio Programmazione Dinamica Metodi basati sul gradiente di policy Q-Learning Modello generativo basato sul gradiente (score-based)

Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →

Leggi il metodo completo

Method map

Fonti

Come citare questa pagina

Metodi correlati

Which method?

Citato da