Wzmocnione uczenie ze sprzężeniem zwrotnym z częściowym nadzorem
Wzmocnione uczenie ze sprzężeniem zwrotnym z częściowym nadzorem (SSRL) łączy standardowe uczenie ze sprzężeniem zwrotnym — gdzie agent uczy się na podstawie rzadkich sygnałów nagrody — z technikami częściowego nadzoru, które wydobywają strukturę z nieetykietowanych interakcji ze środowiskiem. Celem jest poprawa efektywności próbkowania i generalizacji, gdy informacja zwrotna w postaci nagrody jest kosztowna, opóźniona lub dostępna tylko dla ułamka doświadczeń agenta.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/pl/deep-learning/semi-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Adaptacyjne uczenie ze wzmocnieniem dla różnych domenUczenie głębokie↔ compare
- Uczenie ze wzmocnieniemUczenie głębokie↔ compare
- Uczenie ze wzmocnieniem z samonadzoremUczenie głębokie↔ compare
- Transformery z uczeniem półnadzorowanymUczenie głębokie↔ compare
- Uczenie transferowe z uczeniem przez wzmacnianieUczenie głębokie↔ compare
- Słabo nadzorowane uczenie ze wzmocnieniemUczenie głębokie↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →