Machine learning

Pembelajaran Penguatan Dalam

Pembelajaran Penguatan Dalam (Deep Reinforcement Learning) menggabungkan jaringan saraf tiruan dengan pembelajaran penguatan sehingga agen belajar dengan berinteraksi dengan lingkungan, dipopulerkan oleh karya Mnih dan rekan-rekan pada tahun 2015 di Nature mengenai kontrol Atari setingkat manusia. Alih-alih belajar dari kumpulan data berlabel tetap, agen mengambil tindakan, mengamati imbalan, dan secara bertahap membentuk kebijakan yang memaksimalkan imbalan jangka panjang.

Buka di MethodMindSegeraVideoSegeraDownload slides

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Method map

The neighbourhood of related methods — select a node to explore.

Pembelajaran Penguatan Dalam

Pencarian Arsitektur Neu…Random Forest Jaringan Saraf Berulang…XGBoost Differential Evolution Pembelajaran Penguatan A…Pemrograman Dinamis Metode Gradien Kebijakan Q-Learning Model Generatif Berbasis…

Sumber

Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗
Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link ↗

Cara menyitasi halaman ini

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/id/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Pencarian Arsitektur NeuralPembelajaran Mendalam↔ compare
Random ForestPembelajaran Mesin↔ compare
Jaringan Saraf Berulang (Recurrent Neural Network - RNN)Pembelajaran Mendalam↔ compare
XGBoostPembelajaran Mesin↔ compare

Compare side by side →

Dirujuk oleh

Differential Evolution Pembelajaran Penguatan Adaptif Domain Pemrograman Dinamis Metode Gradien Kebijakan Q-Learning Model Generatif Berbasis Skor

Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →

Baca metode selengkapnya

Method map

Sumber

Cara menyitasi halaman ini

Metode terkait

Which method?

Dirujuk oleh