ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Zwakke gesuperviseerde Reinforcement Learning

Zwakke gesuperviseerde reinforcement learning (WSRL) traint agenten in omgevingen waar het beloningssignaal imperfect, schaars, vertraagd of slechts gedeeltelijk informatief is — in tegenstelling tot dichte volledig gesuperviseerde RL. De agent moet effectieve policies leren ondanks onvolledige feedback, gebruikmakend van hulp- of aanvullende signalen, beloningsmodellering of voorkeursleren om te compenseren voor de zwakke supervisie.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
  2. Christiano, P., Leike, J., Brown, T. B., Martic, M., Legg, S. & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems (NeurIPS), 30. link

Deze pagina citeren

ScholarGate. (2026, June 3). Weakly Supervised Reinforcement Learning. ScholarGate. https://scholargate.app/nl/deep-learning/weakly-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Geciteerd door

ScholarGateWeakly supervised reinforcement learning (Weakly Supervised Reinforcement Learning). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/weakly-supervised-reinforcement-learning · Gegevensset: https://doi.org/10.5281/zenodo.20539026