Schwach überwachtes bestärkendes Lernen
Schwaches überwachter bestärkender Lernens (WSRL) trainiert Agenten in Umgebungen, in denen das Belohnungssignal unvollkommen, spärlich, verzögert oder nur teilweise informativ ist – im Gegensatz zu dichten, vollständig überwachten RL. Der Agent muss trotz unvollständigen Feedbacks effektive Strategien erlernen, indem er Hilfssignale, Belohnungsmodellierung oder Präferenzlernen verwendet, um die schwache Überwachung zu kompensieren.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
Quellen
- Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
- Christiano, P., Leike, J., Brown, T. B., Martic, M., Legg, S. & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems (NeurIPS), 30. link ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 3). Weakly Supervised Reinforcement Learning. ScholarGate. https://scholargate.app/de/deep-learning/weakly-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Reinforcement LearningDeep Learning↔ compare
- Selbstüberwachtes bestärkendes LernenDeep Learning↔ compare
- Semi-supervidiertes Reinforcement LearningDeep Learning↔ compare
Referenziert von
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →