ScholarGate
Asisten
Machine learning

Pembelajaran Penguatan Dalam

Pembelajaran Penguatan Dalam (Deep Reinforcement Learning) menggabungkan jaringan saraf tiruan dengan pembelajaran penguatan sehingga agen belajar dengan berinteraksi dengan lingkungan, dipopulerkan oleh karya Mnih dan rekan-rekan pada tahun 2015 di Nature mengenai kontrol Atari setingkat manusia. Alih-alih belajar dari kumpulan data berlabel tetap, agen mengambil tindakan, mengamati imbalan, dan secara bertahap membentuk kebijakan yang memaksimalkan imbalan jangka panjang.

Buka di MethodMindSegeraVideoSegeraDownload slides

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Method map

The neighbourhood of related methods — select a node to explore.

Sumber

  1. Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236
  2. Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link

Cara menyitasi halaman ini

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/id/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Dirujuk oleh

ScholarGateDeep Reinforcement Learning (Deep Reinforcement Learning (DQN / PPO / A3C)). Diakses 2026-06-15 dari https://scholargate.app/id/deep-learning/deep-reinforcement-learning · Set data: https://doi.org/10.5281/zenodo.20539026