ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Schwach überwachtes bestärkendes Lernen

Schwaches überwachter bestärkender Lernens (WSRL) trainiert Agenten in Umgebungen, in denen das Belohnungssignal unvollkommen, spärlich, verzögert oder nur teilweise informativ ist – im Gegensatz zu dichten, vollständig überwachten RL. Der Agent muss trotz unvollständigen Feedbacks effektive Strategien erlernen, indem er Hilfssignale, Belohnungsmodellierung oder Präferenzlernen verwendet, um die schwache Überwachung zu kompensieren.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Quellen

  1. Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
  2. Christiano, P., Leike, J., Brown, T. B., Martic, M., Legg, S. & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems (NeurIPS), 30. link

So zitieren Sie diese Seite

ScholarGate. (2026, June 3). Weakly Supervised Reinforcement Learning. ScholarGate. https://scholargate.app/de/deep-learning/weakly-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referenziert von

ScholarGateWeakly supervised reinforcement learning (Weakly Supervised Reinforcement Learning). Abgerufen am 2026-06-15 von https://scholargate.app/de/deep-learning/weakly-supervised-reinforcement-learning · Datensatz: https://doi.org/10.5281/zenodo.20539026