ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Självövervakad förstärkningsinlärning

Självövervakad förstärkningsinlärning (SSL-RL) utökar standard-RL-träning med självövervakade hjälpmål – såsom kontrastiva, prediktiva eller dataförstärkningsbaserade uppgifter – tillämpade på agentens egen erfarenhet. Dessa mål förbättrar kvaliteten på inlärda representationer utan att kräva extra mänskliga etiketter, vilket möjliggör snabbare konvergens och bättre sampleffektivitet, särskilt i högdimensionella observationsutrymmen som råa pixlar.

Öppna i MethodMindSnartVideoSnartDownload slides

Läs hela metoden

Endast för medlemmar

Logga in med ett kostnadsfritt konto för att läsa avsnittet.

Logga in

Method map

The neighbourhood of related methods — select a node to explore.

Källor

  1. Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link
  2. Laskin, M., Lee, K., Stooke, A., Pinto, L., Abbeel, P., & Srinivas, A. (2021). Reinforcement Learning with Augmented Data. Advances in Neural Information Processing Systems (NeurIPS), 33, 19884–19895. link

Så citerar du den här sidan

ScholarGate. (2026, June 3). Self-supervised Reinforcement Learning (SSL-augmented RL). ScholarGate. https://scholargate.app/sv/deep-learning/self-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Refereras av

ScholarGateSelf-supervised Reinforcement Learning (Self-supervised Reinforcement Learning (SSL-augmented RL)). Hämtad 2026-06-15 från https://scholargate.app/sv/deep-learning/self-supervised-reinforcement-learning · Datamängd: https://doi.org/10.5281/zenodo.20539026