Machine learningDeep learning / NLP / CV

Semi-övervakad förstärkningsinlärning

Semi-övervakad förstärkningsinlärning (SSRL) kombinerar standard förstärkningsinlärning — där en agent lär sig från sparsamma belöningssignaler — med semi-övervakade tekniker som extraherar struktur från omärkta miljöinteraktioner. Målet är att förbättra sampleffektivitet och generalisering när belöningsåterkoppling är kostsam, fördröjd eller endast tillgänglig för en bråkdel av agentens erfarenhet.

Öppna i MethodMindSnartVideoSnartDownload slides

Läs hela metoden

Endast för medlemmar

Logga in med ett kostnadsfritt konto för att läsa avsnittet.

Logga in

Method map

The neighbourhood of related methods — select a node to explore.

Semi-övervakad förstärkningsinlärning

Domänadaptiv förstärknin…Förstärkningsinlärning Självövervakad förstärkn…Semi-supervised Transfor…Transfer Learning med Re…Svagt övervakad förstärk…

Källor

Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗

Så citerar du den här sidan

ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/sv/deep-learning/semi-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Domänadaptiv förstärkningsinlärningDjupinlärning↔ compare
FörstärkningsinlärningDjupinlärning↔ compare
Självövervakad förstärkningsinlärningDjupinlärning↔ compare
Semi-supervised TransformerDjupinlärning↔ compare
Transfer Learning med Reinforcement LearningDjupinlärning↔ compare
Svagt övervakad förstärkningsinlärningDjupinlärning↔ compare

Compare side by side →

Refereras av

Självövervakad förstärkningsinlärning Svagt övervakad förstärkningsinlärning

Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →