Machine learningDeep learning / NLP / CV
도메인 적응 강화학습
도메인 적응 강화학습(Domain-Adaptive Reinforcement Learning, DARL)은 표준 강화학습을 확장하여, 한 환경 또는 도메인에서 훈련된 정책이 관련성이 있는 다른 대상 도메인으로 효과적으로 전이되고 일반화될 수 있도록 합니다. 이는 훈련과 배포 간의 동역학, 관측치 또는 보상 구조가 달라지는 도메인 이동(domain-shift) 문제를 정렬(alignment), 적응(adaptation) 또는 도메인 무작위화(domain randomisation) 기법을 통해 해결함으로써, 대상 도메인에서 비용이 많이 드는 경험을 수집할 필요성을 줄입니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
출처
이 페이지 인용 방법
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/ko/deep-learning/domain-adaptive-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →