Polu-nadgledano pojačavajuće učenje
Polu-nadgledano pojačano učenje (SSRL) kombinira standardno pojačano učenje — gdje agent uči iz oskudnih nagradnih signala — sa polu-nadgledanim tehnikama koje izvlače strukturu iz neoznačenih interakcija s okolinom. Cilj je poboljšati učinkovitost uzorka i generalizaciju kada je povratna informacija o nagradi skupa, odgođena ili dostupna samo za djelić iskustva agenta.
Pročitajte cijelu metodu
Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.
Method map
The neighbourhood of related methods — select a node to explore.
Izvori
- Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/hr/deep-learning/semi-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Domenski adaptivno učenje potkrepljenjemDuboko učenje↔ compare
- Potkrepljivačko učenjeDuboko učenje↔ compare
- Samonadzorirano pojačano učenjeDuboko učenje↔ compare
- Poluučeni TransformerDuboko učenje↔ compare
- Prenosno učenje s potkrepljenim učenjemDuboko učenje↔ compare
- Slabo nadzirano učenje potpomognuto potkrjepljenjemDuboko učenje↔ compare
Citirana u
Uočili ste pogrešku na ovoj stranici? Prijavite je ili predložite ispravak →