Machine learning

Dziļā pastiprinātā mācīšanās

Dziļā pastiprinātā mācīšanās (Deep Reinforcement Learning — DRL) apvieno neironu tīklus ar pastiprināto mācīšanos, lai aģents mācītos, mijiedarbojoties ar vidi. To popularizēja Mnih un kolēģu 2015. gada darbs žurnālā Nature par Atari spēļu kontroli cilvēka līmenī. Tā vietā, lai mācītos no fiksētas marķētas datu kopas, aģents veic darbības, novēro atlīdzības un pakāpeniski veido politiku, kas maksimizē ilgtermiņa atdevi.

Atvērt MethodMindDrīzumāVideoDrīzumāDownload slides

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Method map

The neighbourhood of related methods — select a node to explore.

Dziļā pastiprinātā mācīšanās

Neirālā arhitektūras mek…Random Forest Atkārtotais neironu tīkls XGBoost Diferenciālā evolūcija Domenam adaptīvā pastipr…Dinamiskā programmēšana Metodes ar politikas gra…Q-apmācība Generatīvais modelis, ka…

Avoti

Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗
Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link ↗

Kā citēt šo lapu

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/lv/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Neirālā arhitektūras meklēšanaDziļā mācīšanās↔ compare
Random ForestMašīnmācīšanās↔ compare
Atkārtotais neironu tīklsDziļā mācīšanās↔ compare
XGBoostMašīnmācīšanās↔ compare

Compare side by side →

Uz to atsaucas

Diferenciālā evolūcija Domenam adaptīvā pastiprinājuma mācīšanās Dinamiskā programmēšana Metodes ar politikas gradientu Q-apmācība Generatīvais modelis, kas balstīts uz skaitlisko vērtību (rezultātu)

Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →

Lasīt pilno metodes aprakstu

Method map

Avoti

Kā citēt šo lapu

Saistītās metodes

Which method?

Uz to atsaucas