Domene-adaptiv forsterkningslæring
Domene-adaptiv forsterkningslæring (DARL) utvider standard forsterkningslæring ved å muliggjøre at en policy trent i ett miljø eller domene kan overføres og generaliseres effektivt til et annet, men relatert, måldomene. Den adresserer problemet med domeneskifte – der dynamikk, observasjoner eller belønningsstrukturer avviker mellom trening og utplassering – gjennom teknikker for justering, tilpasning eller domenerandomisering, noe som reduserer behovet for å samle kostbar erfaring i måldomenet.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
Slik siterer du denne siden
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/no/deep-learning/domain-adaptive-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Dyp forsterkningslæringDyp læring↔ compare
- OverføringslæringMaskinlæring↔ compare
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →