Machine learningDeep learning / NLP / CV

Học tăng cường thích ứng miền

Học tăng cường thích ứng miền (DARL) mở rộng RL tiêu chuẩn bằng cách cho phép một chính sách được huấn luyện trong một môi trường hoặc miền có thể chuyển giao và khái quát hóa hiệu quả sang một miền đích khác nhưng có liên quan. Nó giải quyết vấn đề dịch chuyển miền — nơi động lực học, quan sát hoặc cấu trúc phần thưởng khác nhau giữa quá trình huấn luyện và triển khai — thông qua các kỹ thuật căn chỉnh, thích ứng hoặc ngẫu nhiên hóa miền, giảm nhu cầu thu thập kinh nghiệm tốn kém trong miền đích.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link
  2. Domain adaptation. Wikipedia. link

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/vi/deep-learning/domain-adaptive-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateDomain-adaptive reinforcement learning (Domain-Adaptive Reinforcement Learning). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/deep-learning/domain-adaptive-reinforcement-learning · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026