Machine learningDeep learning / NLP / CV

Адаптивне навчання з підкріпленням у різних доменах

Адаптивне навчання з підкріпленням у різних доменах (DARL) розширює стандартне RL, дозволяючи політиці, навченій в одному середовищі або домені, ефективно переноситися та узагальнюватися до іншого, але пов'язаного цільового домену. Воно вирішує проблему зсуву домену — коли динаміка, спостереження або структури винагороди відрізняються між навчанням і розгортанням — за допомогою технік вирівнювання, адаптації або випадкової рандомізації домену, зменшуючи потребу у зборі дорогого досвіду в цільовому домені.

Відкрити у MethodMindНезабаромВідеоНезабаромЗавантажити слайди

Читати метод повністю

Лише для учасників

Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.

Увійти

Карта методів

Околиця споріднених методів — виберіть вузол, щоб дослідити.

Адаптивне навчання з підкріпленням у різних доменах

Глибоке навчання з підкр…Трансферне навчання Напівкероване навчання з…Навчання з перенесенням…

Джерела

Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link ↗
Domain adaptation. Wikipedia. link ↗

Як цитувати цю сторінку

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/uk/deep-learning/domain-adaptive-reinforcement-learning

Який метод?

Поставте цей метод поруч із його найближчими спорідненими й читайте їх пліч-о-пліч — бібліотека викладає книги на стіл; вибір за вами.

Глибоке навчання з підкріпленнямГлибоке навчання↔ порівняти
Трансферне навчанняМашинне навчання↔ порівняти

Порівняти поруч →

Згадується в

Напівкероване навчання з підкріпленням Навчання з перенесенням на основі навчання з підкріпленням

Помітили помилку на цій сторінці? Повідомте про неї або запропонуйте виправлення →