Pembelajaran Penguatan Dalam
Pembelajaran Penguatan Dalam (Deep Reinforcement Learning) menggabungkan jaringan saraf tiruan dengan pembelajaran penguatan sehingga agen belajar dengan berinteraksi dengan lingkungan, dipopulerkan oleh karya Mnih dan rekan-rekan pada tahun 2015 di Nature mengenai kontrol Atari setingkat manusia. Alih-alih belajar dari kumpulan data berlabel tetap, agen mengambil tindakan, mengamati imbalan, dan secara bertahap membentuk kebijakan yang memaksimalkan imbalan jangka panjang.
Baca metode selengkapnya
Masuk dengan akun gratis untuk membaca bagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
Sumber
- Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗
- Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link ↗
Cara menyitasi halaman ini
ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/id/deep-learning/deep-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Pencarian Arsitektur NeuralPembelajaran Mendalam↔ compare
- Random ForestPembelajaran Mesin↔ compare
- Jaringan Saraf Berulang (Recurrent Neural Network - RNN)Pembelajaran Mendalam↔ compare
- XGBoostPembelajaran Mesin↔ compare
Dirujuk oleh
Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →