Machine learningDeep learning / NLP / CV

Uczenie ze wzmocnieniem z samonadzorem

Uczenie ze wzmocnieniem z samonadzorem (SSL-RL) uzupełnia standardowe trenowanie RL o pomocnicze cele samonadzorowane — takie jak zadania oparte na kontrastowości, predykcji lub augmentacji danych — stosowane do własnego doświadczenia agenta. Cele te poprawiają jakość nauczonych reprezentacji bez potrzeby dodatkowych ludzkich etykiet, umożliwiając szybszą zbieżność i lepszą efektywność próbkowania, zwłaszcza w przestrzeniach obserwacji o wysokiej wymiarowości, takich jak surowe piksele.

Otwórz w MethodMindWkrótceWideoWkrótceDownload slides

Przeczytaj pełny opis metody

Tylko dla członków

Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.

Zaloguj się

Method map

The neighbourhood of related methods — select a node to explore.

Źródła

  1. Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link
  2. Laskin, M., Lee, K., Stooke, A., Pinto, L., Abbeel, P., & Srinivas, A. (2021). Reinforcement Learning with Augmented Data. Advances in Neural Information Processing Systems (NeurIPS), 33, 19884–19895. link

Jak cytować tę stronę

ScholarGate. (2026, June 3). Self-supervised Reinforcement Learning (SSL-augmented RL). ScholarGate. https://scholargate.app/pl/deep-learning/self-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Cytowana przez

ScholarGateSelf-supervised Reinforcement Learning (Self-supervised Reinforcement Learning (SSL-augmented RL)). Pobrano 2026-06-15 z https://scholargate.app/pl/deep-learning/self-supervised-reinforcement-learning · Zbiór danych: https://doi.org/10.5281/zenodo.20539026