Machine learningDeep learning / NLP / CV

Învățare prin Recompensă Adaptivă la Domeniu

Învățarea prin Recompensă Adaptivă la Domeniu (DARL) extinde RL standard prin permiterea transferului și generalizării eficiente a unei politici antrenate într-un mediu sau domeniu la un domeniu țintă diferit, dar înrudit. Abordează problema deplasării domeniului — unde dinamica, observațiile sau structurile de recompensă diferă între antrenare și implementare — prin tehnici de aliniere, adaptare sau randomizare a domeniului, reducând nevoia de a colecta experiență costisitoare în domeniul țintă.

Deschide în MethodMindÎn curândVideoÎn curândDescarcă prezentarea

Citește metoda completă

Doar pentru membri

Autentifică-te cu un cont gratuit pentru a citi această secțiune.

Autentificare

Harta metodelor

Vecinătatea metodelor înrudite — selectați un nod pentru a explora.

Învățare prin Recompensă Adaptivă la Domeniu

Învățare prin consolidar…Învățare prin transfer Învățare prin consolidar…Învățarea prin Transfer…

Surse

Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link ↗
Domain adaptation. Wikipedia. link ↗

Cum se citează această pagină

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/ro/deep-learning/domain-adaptive-reinforcement-learning

Ce metodă?

Așezați această metodă lângă cele mai apropiate rude și citiți-le alăturat — biblioteca pune cărțile pe masă; alegerea vă aparține.

Învățare prin consolidare profundăÎnvățare profundă↔ compară
Învățare prin transferÎnvățare automată↔ compară

Compară alăturat →

Citat de

Învățare prin consolidare semi-supervizată Învățarea prin Transfer cu Învățare prin Consolidare

Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →