Machine learningDeep learning / NLP / CV

Zwakke gesuperviseerde Reinforcement Learning

Zwakke gesuperviseerde reinforcement learning (WSRL) traint agenten in omgevingen waar het beloningssignaal imperfect, schaars, vertraagd of slechts gedeeltelijk informatief is — in tegenstelling tot dichte volledig gesuperviseerde RL. De agent moet effectieve policies leren ondanks onvolledige feedback, gebruikmakend van hulp- of aanvullende signalen, beloningsmodellering of voorkeursleren om te compenseren voor de zwakke supervisie.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Zwakke gesuperviseerde Reinforcement Learning

Reinforcement Learning Zelfgesuperviseerd Reinf…Semi-gesuperviseerd Rein…

Bronnen

Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
Christiano, P., Leike, J., Brown, T. B., Martic, M., Legg, S. & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems (NeurIPS), 30. link ↗

Deze pagina citeren

ScholarGate. (2026, June 3). Weakly Supervised Reinforcement Learning. ScholarGate. https://scholargate.app/nl/deep-learning/weakly-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Reinforcement LearningDeep learning↔ compare
Zelfgesuperviseerd Reinforcement LearningDeep learning↔ compare
Semi-gesuperviseerd Reinforcement LearningDeep learning↔ compare

Compare side by side →

Geciteerd door

Semi-gesuperviseerd Reinforcement Learning

Een fout op deze pagina gezien? Meld het of stel een correctie voor →