ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Semi-gesuperviseerd Reinforcement Learning

Semi-gesuperviseerd reinforcement learning (SSRL) combineert standaard reinforcement learning — waarbij een agent leert van schaarse beloningssignalen — met semi-gesuperviseerde technieken die structuur extraheren uit ongelabelde omgevingsinteracties. Het doel is om de sample-efficiëntie en generalisatie te verbeteren wanneer beloningsfeedback kostbaar, vertraagd of slechts voor een fractie van de ervaring van de agent beschikbaar is.

Openen in MethodMindBinnenkortVideoBinnenkortDia's downloaden

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Methodenkaart

De omgeving van verwante methoden — selecteer een knooppunt om te verkennen.

Bronnen

  1. Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link
  2. Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link

Deze pagina citeren

ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/nl/deep-learning/semi-supervised-reinforcement-learning

Welke methode?

Plaats deze methode naast haar naaste verwanten en lees ze naast elkaar — de bibliotheek legt de boeken op tafel; de keuze is aan u.

Naast elkaar vergelijken

Geciteerd door

ScholarGateSemi-supervised Reinforcement Learning (Semi-supervised Reinforcement Learning (SSRL)). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/semi-supervised-reinforcement-learning · Gegevensset: https://doi.org/10.5281/zenodo.20539026