Machine learningDeep learning / NLP / CV

Semi-gesuperviseerd Reinforcement Learning

Semi-gesuperviseerd reinforcement learning (SSRL) combineert standaard reinforcement learning — waarbij een agent leert van schaarse beloningssignalen — met semi-gesuperviseerde technieken die structuur extraheren uit ongelabelde omgevingsinteracties. Het doel is om de sample-efficiëntie en generalisatie te verbeteren wanneer beloningsfeedback kostbaar, vertraagd of slechts voor een fractie van de ervaring van de agent beschikbaar is.

Openen in MethodMindBinnenkortVideoBinnenkortDia's downloaden

Lees de volledige methode

Alleen voor leden

Inloggen

Methodenkaart

De omgeving van verwante methoden — selecteer een knooppunt om te verkennen.

Semi-gesuperviseerd Reinforcement Learning

Domein-adaptieve Reinfor…Reinforcement Learning Zelfgesuperviseerd Reinf…Semi-supervised Transfor…Transfer Learning met Re…Zwakke gesuperviseerde R…

Bronnen

Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗

Deze pagina citeren

ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/nl/deep-learning/semi-supervised-reinforcement-learning

Welke methode?

Plaats deze methode naast haar naaste verwanten en lees ze naast elkaar — de bibliotheek legt de boeken op tafel; de keuze is aan u.

Domein-adaptieve Reinforcement LearningDeep learning↔ vergelijken
Reinforcement LearningDeep learning↔ vergelijken
Zelfgesuperviseerd Reinforcement LearningDeep learning↔ vergelijken
Semi-supervised TransformerDeep learning↔ vergelijken
Transfer Learning met Reinforcement LearningDeep learning↔ vergelijken
Zwakke gesuperviseerde Reinforcement LearningDeep learning↔ vergelijken

Naast elkaar vergelijken →

Geciteerd door

Zelfgesuperviseerd Reinforcement Learning Zwakke gesuperviseerde Reinforcement Learning

Een fout op deze pagina gezien? Meld het of stel een correctie voor →