Dziļā pastiprinātā mācīšanās
Dziļā pastiprinātā mācīšanās (Deep Reinforcement Learning — DRL) apvieno neironu tīklus ar pastiprināto mācīšanos, lai aģents mācītos, mijiedarbojoties ar vidi. To popularizēja Mnih un kolēģu 2015. gada darbs žurnālā Nature par Atari spēļu kontroli cilvēka līmenī. Tā vietā, lai mācītos no fiksētas marķētas datu kopas, aģents veic darbības, novēro atlīdzības un pakāpeniski veido politiku, kas maksimizē ilgtermiņa atdevi.
Lasīt pilno metodes aprakstu
Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.
Method map
The neighbourhood of related methods — select a node to explore.
Avoti
- Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗
- Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link ↗
Kā citēt šo lapu
ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/lv/deep-learning/deep-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Neirālā arhitektūras meklēšanaDziļā mācīšanās↔ compare
- Random ForestMašīnmācīšanās↔ compare
- Atkārtotais neironu tīklsDziļā mācīšanās↔ compare
- XGBoostMašīnmācīšanās↔ compare
Uz to atsaucas
Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →