ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Selv-overvåket forsterkningslæring

Selv-overvåket forsterkningslæring (SSL-RL) utvider standard RL-trening med selv-overvåkede hjelpeformål – som kontrastive, prediktive eller datagenereringsbaserte oppgaver – anvendt på agentens egen erfaring. Disse formålene forbedrer kvaliteten på lærte representasjoner uten å kreve ekstra menneskelige merkelapper, noe som muliggjør raskere konvergens og bedre utnyttelse av prøver, spesielt i høydimensjonale observasjonsrom som rå piksler.

Åpne i MethodMindSnartVideoSnartDownload slides

Les hele metoden

Kun for medlemmer

Logg inn med en gratis konto for å lese denne delen.

Logg inn

Method map

The neighbourhood of related methods — select a node to explore.

Kilder

  1. Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link
  2. Laskin, M., Lee, K., Stooke, A., Pinto, L., Abbeel, P., & Srinivas, A. (2021). Reinforcement Learning with Augmented Data. Advances in Neural Information Processing Systems (NeurIPS), 33, 19884–19895. link

Slik siterer du denne siden

ScholarGate. (2026, June 3). Self-supervised Reinforcement Learning (SSL-augmented RL). ScholarGate. https://scholargate.app/no/deep-learning/self-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referert av

ScholarGateSelf-supervised Reinforcement Learning (Self-supervised Reinforcement Learning (SSL-augmented RL)). Hentet 2026-06-15 fra https://scholargate.app/no/deep-learning/self-supervised-reinforcement-learning · Datasett: https://doi.org/10.5281/zenodo.20539026