Domänadaptiv förstärkningsinlärning
Domänadaptiv förstärkningsinlärning (DARL) utökar standard-RL genom att möjliggöra att en policy som tränats i en miljö eller domän kan överföras och generaliseras effektivt till en annan, men relaterad, måldomän. Den hanterar problemet med domänförskjutning – där dynamik, observationer eller belöningsstrukturer skiljer sig mellan träning och driftsättning – genom tekniker för anpassning, justering eller domänrandomisering, vilket minskar behovet av att samla in kostsam erfarenhet i måldomänen.
Läs hela metoden
Logga in med ett kostnadsfritt konto för att läsa avsnittet.
Method map
The neighbourhood of related methods — select a node to explore.
Källor
Så citerar du den här sidan
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/sv/deep-learning/domain-adaptive-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Djup förstärkningsinlärningDjupinlärning↔ compare
- ÖverföringsinlärningMaskininlärning↔ compare
Refereras av
Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →