Valdkonnaspetsiifiline tugevdatud õppimine
Valdkonnaspetsiifiline tugevdatud õppimine (DARL) laiendab standardset tugevdatud õppimist, võimaldades ühes keskkonnas või valdkonnas treenitud poliitikal tõhusalt üle kanda ja üldistada teisele, kuid seotud sihtvaldkonnale. See lahendab valdkonnanihkega seotud probleemi – kus dünaamika, vaatlused või tasustruktuurid erinevad treening- ja kasutuselevõtuperioodi vahel – kasutades selleks joondamis-, kohanemis- või valdkonna randomiseerimise tehnikaid, vähendades vajadust koguda sihtvaldkonnas kulukaid kogemusi.
Loe meetodi täielikku kirjeldust
Selle osa lugemiseks logi sisse tasuta kontoga.
Method map
The neighbourhood of related methods — select a node to explore.
Allikad
Kuidas sellele lehele viidata
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/et/deep-learning/domain-adaptive-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Süva tugevdamisõpeSüvaõpe↔ compare
- ÜlekandeõpeMasinõpe↔ compare
Sellele viitavad
Märkasid sellel lehel viga? Teata sellest või paku parandust →