Pembelajaran Penguatan Adaptif Domain
Pembelajaran Penguatan Adaptif Domain (DARL) memperluas RL standar dengan memungkinkan kebijakan yang dilatih di satu lingkungan atau domain untuk ditransfer dan digeneralisasi secara efektif ke domain target yang berbeda namun terkait. Ini mengatasi masalah pergeseran domain — di mana dinamika, observasi, atau struktur imbalan berbeda antara pelatihan dan penerapan — melalui teknik penyelarasan, adaptasi, atau randomisasi domain, mengurangi kebutuhan untuk mengumpulkan pengalaman yang mahal di domain target.
Baca metode selengkapnya
Masuk dengan akun gratis untuk membaca bagian ini.
Peta metode
Lingkup metode terkait — pilih sebuah simpul untuk menjelajah.
Sumber
Cara menyitasi halaman ini
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/id/deep-learning/domain-adaptive-reinforcement-learning
Metode yang mana?
Letakkan metode ini berdampingan dengan kerabat terdekatnya dan baca secara bersisian — pustaka menata bukunya di atas meja; pilihan ada di tangan Anda.
- Pembelajaran Penguatan DalamPembelajaran Mendalam↔ bandingkan
- Transfer LearningPembelajaran Mesin↔ bandingkan
Dirujuk oleh
Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →