Machine learningDeep learning / NLP / CV

도메인 적응 강화학습

도메인 적응 강화학습(Domain-Adaptive Reinforcement Learning, DARL)은 표준 강화학습을 확장하여, 한 환경 또는 도메인에서 훈련된 정책이 관련성이 있는 다른 대상 도메인으로 효과적으로 전이되고 일반화될 수 있도록 합니다. 이는 훈련과 배포 간의 동역학, 관측치 또는 보상 구조가 달라지는 도메인 이동(domain-shift) 문제를 정렬(alignment), 적응(adaptation) 또는 도메인 무작위화(domain randomisation) 기법을 통해 해결함으로써, 대상 도메인에서 비용이 많이 드는 경험을 수집할 필요성을 줄입니다.

MethodMind에서 열기곧 제공동영상곧 제공Download slides

방법 전문 읽기

회원 전용

무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.

로그인

Method map

The neighbourhood of related methods — select a node to explore.

출처

  1. Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link
  2. Domain adaptation. Wikipedia. link

이 페이지 인용 방법

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/ko/deep-learning/domain-adaptive-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

이 방법을 참조하는 항목

ScholarGateDomain-adaptive reinforcement learning (Domain-Adaptive Reinforcement Learning). 2026-06-15에 다음에서 검색함: https://scholargate.app/ko/deep-learning/domain-adaptive-reinforcement-learning · 데이터셋: https://doi.org/10.5281/zenodo.20539026