Självövervakad förstärkningsinlärning
Självövervakad förstärkningsinlärning (SSL-RL) utökar standard-RL-träning med självövervakade hjälpmål – såsom kontrastiva, prediktiva eller dataförstärkningsbaserade uppgifter – tillämpade på agentens egen erfarenhet. Dessa mål förbättrar kvaliteten på inlärda representationer utan att kräva extra mänskliga etiketter, vilket möjliggör snabbare konvergens och bättre sampleffektivitet, särskilt i högdimensionella observationsutrymmen som råa pixlar.
Läs hela metoden
Logga in med ett kostnadsfritt konto för att läsa avsnittet.
Method map
The neighbourhood of related methods — select a node to explore.
Källor
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
- Laskin, M., Lee, K., Stooke, A., Pinto, L., Abbeel, P., & Srinivas, A. (2021). Reinforcement Learning with Augmented Data. Advances in Neural Information Processing Systems (NeurIPS), 33, 19884–19895. link ↗
Så citerar du den här sidan
ScholarGate. (2026, June 3). Self-supervised Reinforcement Learning (SSL-augmented RL). ScholarGate. https://scholargate.app/sv/deep-learning/self-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- FörstärkningsinlärningDjupinlärning↔ compare
- Självövervakad faltningsnätverkDjupinlärning↔ compare
- Semi-övervakad förstärkningsinlärningDjupinlärning↔ compare
- Transfer Learning med Reinforcement LearningDjupinlärning↔ compare
Refereras av
Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →