Machine learningDeep learning / NLP / CV

Schwach überwachtes bestärkendes Lernen

Schwaches überwachter bestärkender Lernens (WSRL) trainiert Agenten in Umgebungen, in denen das Belohnungssignal unvollkommen, spärlich, verzögert oder nur teilweise informativ ist – im Gegensatz zu dichten, vollständig überwachten RL. Der Agent muss trotz unvollständigen Feedbacks effektive Strategien erlernen, indem er Hilfssignale, Belohnungsmodellierung oder Präferenzlernen verwendet, um die schwache Überwachung zu kompensieren.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Schwach überwachtes bestärkendes Lernen

Reinforcement Learning Selbstüberwachtes bestär…Semi-supervidiertes Rein…

Quellen

Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
Christiano, P., Leike, J., Brown, T. B., Martic, M., Legg, S. & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems (NeurIPS), 30. link ↗

So zitieren Sie diese Seite

ScholarGate. (2026, June 3). Weakly Supervised Reinforcement Learning. ScholarGate. https://scholargate.app/de/deep-learning/weakly-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Reinforcement LearningDeep Learning↔ compare
Selbstüberwachtes bestärkendes LernenDeep Learning↔ compare
Semi-supervidiertes Reinforcement LearningDeep Learning↔ compare

Compare side by side →

Referenziert von

Semi-supervidiertes Reinforcement Learning

Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →