Apprentissage par renforcement adaptatif au domaine
L'apprentissage par renforcement adaptatif au domaine (DARL) étend l'apprentissage par renforcement standard en permettant à une politique entraînée dans un environnement ou un domaine de se transférer et de généraliser efficacement à un domaine cible différent mais connexe. Il aborde le problème du décalage de domaine — où la dynamique, les observations ou les structures de récompense diffèrent entre l'entraînement et le déploiement — par des techniques d'alignement, d'adaptation ou de randomisation de domaine, réduisant ainsi le besoin de collecter des expériences coûteuses dans le domaine cible.
Lire la méthode complète
Connectez-vous avec un compte gratuit pour lire cette section.
Method map
The neighbourhood of related methods — select a node to explore.
Sources
Comment citer cette page
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/fr/deep-learning/domain-adaptive-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Apprentissage par renforcement profondApprentissage profond↔ compare
- Apprentissage par transfertApprentissage automatique↔ compare
Référencée par
Une erreur sur cette page ? Signalez-la ou proposez une correction →