Zwakke gesuperviseerde Reinforcement Learning
Zwakke gesuperviseerde reinforcement learning (WSRL) traint agenten in omgevingen waar het beloningssignaal imperfect, schaars, vertraagd of slechts gedeeltelijk informatief is — in tegenstelling tot dichte volledig gesuperviseerde RL. De agent moet effectieve policies leren ondanks onvolledige feedback, gebruikmakend van hulp- of aanvullende signalen, beloningsmodellering of voorkeursleren om te compenseren voor de zwakke supervisie.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Method map
The neighbourhood of related methods — select a node to explore.
Bronnen
- Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
- Christiano, P., Leike, J., Brown, T. B., Martic, M., Legg, S. & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems (NeurIPS), 30. link ↗
Deze pagina citeren
ScholarGate. (2026, June 3). Weakly Supervised Reinforcement Learning. ScholarGate. https://scholargate.app/nl/deep-learning/weakly-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Reinforcement LearningDeep learning↔ compare
- Zelfgesuperviseerd Reinforcement LearningDeep learning↔ compare
- Semi-gesuperviseerd Reinforcement LearningDeep learning↔ compare
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →