ScholarGate
Asistent
Machine learningDeep learning / NLP / CV

Învățare prin Recompensă Adaptivă la Domeniu

Învățarea prin Recompensă Adaptivă la Domeniu (DARL) extinde RL standard prin permiterea transferului și generalizării eficiente a unei politici antrenate într-un mediu sau domeniu la un domeniu țintă diferit, dar înrudit. Abordează problema deplasării domeniului — unde dinamica, observațiile sau structurile de recompensă diferă între antrenare și implementare — prin tehnici de aliniere, adaptare sau randomizare a domeniului, reducând nevoia de a colecta experiență costisitoare în domeniul țintă.

Deschide în MethodMindÎn curândVideoÎn curândDescarcă prezentarea

Citește metoda completă

Doar pentru membri

Autentifică-te cu un cont gratuit pentru a citi această secțiune.

Autentificare

Harta metodelor

Vecinătatea metodelor înrudite — selectați un nod pentru a explora.

Surse

  1. Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link
  2. Domain adaptation. Wikipedia. link

Cum se citează această pagină

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/ro/deep-learning/domain-adaptive-reinforcement-learning

Ce metodă?

Așezați această metodă lângă cele mai apropiate rude și citiți-le alăturat — biblioteca pune cărțile pe masă; alegerea vă aparține.

Compară alăturat

Citat de

ScholarGateDomain-adaptive reinforcement learning (Domain-Adaptive Reinforcement Learning). Preluat la 2026-06-15 de pe https://scholargate.app/ro/deep-learning/domain-adaptive-reinforcement-learning · Set de date: https://doi.org/10.5281/zenodo.20539026