ScholarGate
Асистент
Machine learningDeep learning / NLP / CV

Адаптивне навчання з підкріпленням у різних доменах

Адаптивне навчання з підкріпленням у різних доменах (DARL) розширює стандартне RL, дозволяючи політиці, навченій в одному середовищі або домені, ефективно переноситися та узагальнюватися до іншого, але пов'язаного цільового домену. Воно вирішує проблему зсуву домену — коли динаміка, спостереження або структури винагороди відрізняються між навчанням і розгортанням — за допомогою технік вирівнювання, адаптації або випадкової рандомізації домену, зменшуючи потребу у зборі дорогого досвіду в цільовому домені.

Відкрити у MethodMindНезабаромВідеоНезабаромЗавантажити слайди

Читати метод повністю

Лише для учасників

Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.

Увійти

Карта методів

Околиця споріднених методів — виберіть вузол, щоб дослідити.

Джерела

  1. Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link
  2. Domain adaptation. Wikipedia. link

Як цитувати цю сторінку

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/uk/deep-learning/domain-adaptive-reinforcement-learning

Який метод?

Поставте цей метод поруч із його найближчими спорідненими й читайте їх пліч-о-пліч — бібліотека викладає книги на стіл; вибір за вами.

Порівняти поруч

Згадується в

ScholarGateDomain-adaptive reinforcement learning (Domain-Adaptive Reinforcement Learning). Отримано 2026-06-15 з https://scholargate.app/uk/deep-learning/domain-adaptive-reinforcement-learning · Набір даних: https://doi.org/10.5281/zenodo.20539026