Machine learningDeep learning / NLP / CV

Polu-nadgledano pojačavajuće učenje

Polu-nadgledano pojačano učenje (SSRL) kombinira standardno pojačano učenje — gdje agent uči iz oskudnih nagradnih signala — sa polu-nadgledanim tehnikama koje izvlače strukturu iz neoznačenih interakcija s okolinom. Cilj je poboljšati učinkovitost uzorka i generalizaciju kada je povratna informacija o nagradi skupa, odgođena ili dostupna samo za djelić iskustva agenta.

Otvorite u MethodMindUskoroVideoUskoroDownload slides

Pročitajte cijelu metodu

Samo za članove

Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.

Prijavite se

Method map

The neighbourhood of related methods — select a node to explore.

Polu-nadgledano pojačavajuće učenje

Domenski adaptivno učenj…Potkrepljivačko učenje Samonadzorirano pojačano…Poluučeni Transformer Prenosno učenje s potkre…Slabo nadzirano učenje p…

Izvori

Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗

Kako citirati ovu stranicu

ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/hr/deep-learning/semi-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Domenski adaptivno učenje potkrepljenjemDuboko učenje↔ compare
Potkrepljivačko učenjeDuboko učenje↔ compare
Samonadzorirano pojačano učenjeDuboko učenje↔ compare
Poluučeni TransformerDuboko učenje↔ compare
Prenosno učenje s potkrepljenim učenjemDuboko učenje↔ compare
Slabo nadzirano učenje potpomognuto potkrjepljenjemDuboko učenje↔ compare

Compare side by side →

Citirana u

Samonadzorirano pojačano učenje Slabo nadzirano učenje potpomognuto potkrjepljenjem

Uočili ste pogrešku na ovoj stranici? Prijavite je ili predložite ispravak →