Machine learning

Dziļā pastiprinātā mācīšanās

Dziļā pastiprinātā mācīšanās (Deep Reinforcement Learning — DRL) apvieno neironu tīklus ar pastiprināto mācīšanos, lai aģents mācītos, mijiedarbojoties ar vidi. To popularizēja Mnih un kolēģu 2015. gada darbs žurnālā Nature par Atari spēļu kontroli cilvēka līmenī. Tā vietā, lai mācītos no fiksētas marķētas datu kopas, aģents veic darbības, novēro atlīdzības un pakāpeniski veido politiku, kas maksimizē ilgtermiņa atdevi.

Atvērt MethodMindDrīzumāVideoDrīzumāDownload slides

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Method map

The neighbourhood of related methods — select a node to explore.

Avoti

  1. Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236
  2. Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link

Kā citēt šo lapu

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/lv/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Uz to atsaucas

ScholarGateDeep Reinforcement Learning (Deep Reinforcement Learning (DQN / PPO / A3C)). Izgūts 2026-06-15 no https://scholargate.app/lv/deep-learning/deep-reinforcement-learning · Datu kopa: https://doi.org/10.5281/zenodo.20539026