Machine learningDeep learning / NLP / CV

Valdkonnaspetsiifiline tugevdatud õppimine

Valdkonnaspetsiifiline tugevdatud õppimine (DARL) laiendab standardset tugevdatud õppimist, võimaldades ühes keskkonnas või valdkonnas treenitud poliitikal tõhusalt üle kanda ja üldistada teisele, kuid seotud sihtvaldkonnale. See lahendab valdkonnanihkega seotud probleemi – kus dünaamika, vaatlused või tasustruktuurid erinevad treening- ja kasutuselevõtuperioodi vahel – kasutades selleks joondamis-, kohanemis- või valdkonna randomiseerimise tehnikaid, vähendades vajadust koguda sihtvaldkonnas kulukaid kogemusi.

Ava rakenduses MethodMindPeagiVideoPeagiDownload slides

Loe meetodi täielikku kirjeldust

Ainult liikmetele

Selle osa lugemiseks logi sisse tasuta kontoga.

Logi sisse

Method map

The neighbourhood of related methods — select a node to explore.

Valdkonnaspetsiifiline tugevdatud õppimine

Süva tugevdamisõpe Ülekandeõpe Poolitud õppimisega tuge…Ülekandeõpe koos tugevdu…

Allikad

Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link ↗
Domain adaptation. Wikipedia. link ↗

Kuidas sellele lehele viidata

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/et/deep-learning/domain-adaptive-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Süva tugevdamisõpeSüvaõpe↔ compare
ÜlekandeõpeMasinõpe↔ compare

Compare side by side →

Sellele viitavad

Poolitud õppimisega tugevdamine Ülekandeõpe koos tugevdusõppega

Märkasid sellel lehel viga? Teata sellest või paku parandust →