Polosupervizované posilňovanie učenia
Polovica nadzoruvaného posilňovaného učenia (SSRL) kombinuje štandardné posilňované učenie – kde sa agent učí zo zriedkavých signálov odmeny – s polovica nadzoruvanými technikami, ktoré extrahujú štruktúru z neoznačených interakcií s prostredím. Cieľom je zlepšiť efektívnosť vzoriek a zovšeobecnenie, keď je spätná väzba odmeny nákladná, oneskorená alebo dostupná iba pre zlomok skúseností agenta.
Prečítať celú metódu
Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
Ako citovať túto stránku
ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/sk/deep-learning/semi-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Doménovo adaptívne posilňované učenieHlboké učenie↔ compare
- Reinforcement LearningHlboké učenie↔ compare
- Reinforcement Learning so SamoučenímHlboké učenie↔ compare
- Polosamoučený TransformerHlboké učenie↔ compare
- Prenosové učenie s posilňovaným učenímHlboké učenie↔ compare
- Slabá riadená výučba posilňovanímHlboké učenie↔ compare
Odkazujú sem
Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →