ScholarGate
Асистент
Machine learningDeep learning / NLP / CV

Domain-Adaptive Reinforcement Learning

Представете си обучението на робот във физически симулатор (изходен домейн), а след това внедряването му в реалния свят (целеви домейн). Наученото поведение на робота често деградира, защото симулаторът никога не е перфектно копие на реалността — осветлението, триенето, шумът от сензорите и масите на обектите се различават. Доменно-адаптивното RL преодолява тази празнина чрез изрично моделиране или минимизиране на несъответствието между двете среди по време на обучение, така че политиката остава функционална, когато бъде внедрена там, където наистина има значение. Същата логика се прилага и за NLP агенти, обучени на един корпус, след което използвани на друг, или CV-базирани контролери, обучени на един визуален стил, след което тествани в друг.

Отворете в MethodMindСкороВидеоСкороИзтегляне на слайдове

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Карта на методите

Обкръжението на сродните методи — изберете възел, за да го разгледате.

Източници

  1. Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link
  2. Domain adaptation. Wikipedia. link

Как да цитирате тази страница

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/bg/deep-learning/domain-adaptive-reinforcement-learning

Кой метод?

Поставете този метод до най-близките му сродни методи и ги четете едно до друго — библиотеката полага книгите на масата; изборът е ваш.

Сравняване едно до друго

Цитиран в

ScholarGateDomain-adaptive reinforcement learning (Domain-Adaptive Reinforcement Learning). Извлечено на 2026-06-15 от https://scholargate.app/bg/deep-learning/domain-adaptive-reinforcement-learning · Набор от данни: https://doi.org/10.5281/zenodo.20539026