Machine learningDeep learning / NLP / CV

Domain-Adaptive Reinforcement Learning

Представете си обучението на робот във физически симулатор (изходен домейн), а след това внедряването му в реалния свят (целеви домейн). Наученото поведение на робота често деградира, защото симулаторът никога не е перфектно копие на реалността — осветлението, триенето, шумът от сензорите и масите на обектите се различават. Доменно-адаптивното RL преодолява тази празнина чрез изрично моделиране или минимизиране на несъответствието между двете среди по време на обучение, така че политиката остава функционална, когато бъде внедрена там, където наистина има значение. Същата логика се прилага и за NLP агенти, обучени на един корпус, след което използвани на друг, или CV-базирани контролери, обучени на един визуален стил, след което тествани в друг.

Отворете в MethodMindСкороВидеоСкороИзтегляне на слайдове

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Карта на методите

Обкръжението на сродните методи — изберете възел, за да го разгледате.

Domain-adaptive reinforcement learning

Дълбоко обучение с подкр…Трансферно обучение Полу-наблюдавано обучени…Трансферно обучение с об…

Източници

Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link ↗
Domain adaptation. Wikipedia. link ↗

Как да цитирате тази страница

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/bg/deep-learning/domain-adaptive-reinforcement-learning

Кой метод?

Поставете този метод до най-близките му сродни методи и ги четете едно до друго — библиотеката полага книгите на масата; изборът е ваш.

Дълбоко обучение с подкреплениеДълбоко обучение↔ сравняване
Трансферно обучениеМашинно обучение↔ сравняване

Сравняване едно до друго →

Цитиран в

Полу-наблюдавано обучение с подсилване Трансферно обучение с обучение с подсилване

Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →