Semi-gesuperviseerd Reinforcement Learning
Semi-gesuperviseerd reinforcement learning (SSRL) combineert standaard reinforcement learning — waarbij een agent leert van schaarse beloningssignalen — met semi-gesuperviseerde technieken die structuur extraheren uit ongelabelde omgevingsinteracties. Het doel is om de sample-efficiëntie en generalisatie te verbeteren wanneer beloningsfeedback kostbaar, vertraagd of slechts voor een fractie van de ervaring van de agent beschikbaar is.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Methodenkaart
De omgeving van verwante methoden — selecteer een knooppunt om te verkennen.
Bronnen
- Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
Deze pagina citeren
ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/nl/deep-learning/semi-supervised-reinforcement-learning
Welke methode?
Plaats deze methode naast haar naaste verwanten en lees ze naast elkaar — de bibliotheek legt de boeken op tafel; de keuze is aan u.
- Domein-adaptieve Reinforcement LearningDeep learning↔ vergelijken
- Reinforcement LearningDeep learning↔ vergelijken
- Zelfgesuperviseerd Reinforcement LearningDeep learning↔ vergelijken
- Semi-supervised TransformerDeep learning↔ vergelijken
- Transfer Learning met Reinforcement LearningDeep learning↔ vergelijken
- Zwakke gesuperviseerde Reinforcement LearningDeep learning↔ vergelijken
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →