Domæne-adaptiv forstærkningslæring
Domæne-adaptiv forstærkningslæring (DARL) udvider standard RL ved at gøre det muligt for en politik, der er trænet i ét miljø eller domæne, at overføre og generalisere effektivt til et andet, men beslægtet måldomæne. Den adresserer domæneskifteproblemet – hvor dynamik, observationer eller belønningsstrukturer adskiller sig mellem træning og implementering – gennem justering, tilpasning eller domænerandomiseringsteknikker, hvilket reducerer behovet for at indsamle kostbar erfaring i måldomænet.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
Sådan citerer du denne side
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/da/deep-learning/domain-adaptive-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Dyb ForstærkningslæringDyb læring↔ compare
- OverførselslæringMaskinlæring↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →