Învățare prin Recompensă Adaptivă la Domeniu
Învățarea prin Recompensă Adaptivă la Domeniu (DARL) extinde RL standard prin permiterea transferului și generalizării eficiente a unei politici antrenate într-un mediu sau domeniu la un domeniu țintă diferit, dar înrudit. Abordează problema deplasării domeniului — unde dinamica, observațiile sau structurile de recompensă diferă între antrenare și implementare — prin tehnici de aliniere, adaptare sau randomizare a domeniului, reducând nevoia de a colecta experiență costisitoare în domeniul țintă.
Citește metoda completă
Autentifică-te cu un cont gratuit pentru a citi această secțiune.
Harta metodelor
Vecinătatea metodelor înrudite — selectați un nod pentru a explora.
Surse
Cum se citează această pagină
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/ro/deep-learning/domain-adaptive-reinforcement-learning
Ce metodă?
Așezați această metodă lângă cele mai apropiate rude și citiți-le alăturat — biblioteca pune cărțile pe masă; alegerea vă aparține.
- Învățare prin consolidare profundăÎnvățare profundă↔ compară
- Învățare prin transferÎnvățare automată↔ compară
Citat de
Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →