Apprendimento per Rinforzo Auto-supervisionato
L'apprendimento per rinforzo auto-supervisionato (SSL-RL) potenzia l'addestramento standard dell'RL con obiettivi ausiliari auto-supervisionati — come compiti contrastivi, predittivi o basati sull'aumento dei dati — applicati all'esperienza dell'agente stesso. Questi obiettivi migliorano la qualità delle rappresentazioni apprese senza richiedere etichette umane aggiuntive, consentendo una convergenza più rapida e una migliore efficienza dei campioni, specialmente in spazi di osservazione ad alta dimensionalità come i pixel grezzi.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
Fonti
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
- Laskin, M., Lee, K., Stooke, A., Pinto, L., Abbeel, P., & Srinivas, A. (2021). Reinforcement Learning with Augmented Data. Advances in Neural Information Processing Systems (NeurIPS), 33, 19884–19895. link ↗
Come citare questa pagina
ScholarGate. (2026, June 3). Self-supervised Reinforcement Learning (SSL-augmented RL). ScholarGate. https://scholargate.app/it/deep-learning/self-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Apprendimento per rinforzoApprendimento profondo↔ compare
- Rete Neurale Convoluzionale Auto-SupervisionataApprendimento profondo↔ compare
- Apprendimento per Rinforzo Semi-SupervisionatoApprendimento profondo↔ compare
- Apprendimento per Trasferimento con Apprendimento per RinforzoApprendimento profondo↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →