Semi-supervised Reinforcement Learning
Semi-supervised reinforcement learning (SSRL) kombinuje standardní učení posilováním (reinforcement learning) – kde se agent učí z řídkých signálů odměny – s technikami semi-supervised učení, které extrahují strukturu z neoznačených interakcí s prostředím. Cílem je zlepšit efektivitu vzorkování a generalizaci v situacích, kdy je zpětná vazba odměny nákladná, zpožděná nebo dostupná pouze pro zlomek zkušeností agenta.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/cs/deep-learning/semi-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Doménově adaptivní zpětné učeníHluboké učení↔ compare
- Zpětnovazební učeníHluboké učení↔ compare
- Samoučící se zpatňovací učeníHluboké učení↔ compare
- Semi-supervised TransformerHluboké učení↔ compare
- Přenosové učení s učením posilovánímHluboké učení↔ compare
- Slabě řízené zpětné učeníHluboké učení↔ compare
Odkazuje sem
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →