Machine learningDeep learning / NLP / CV

Mācīšanās ar pastiprinājumu

Mācīšanās ar pastiprinājumu (RL) ir ietvars, kurā aģents mācās pieņemt secīgus lēmumus, mijiedarbojoties ar vidi, saņemot skalārus atlīdzības signālus un atjauninot politiku, lai maksimizētu kumulatīvo nākotnes atlīdzību. Atšķirībā no uzraudzītās mācīšanās, netiek sniegti marķēti piemēri; aģents atklāj optimālu uzvedību pilnībā, izmantojot pieredzi un novēlotu atgriezenisko saiti.

Atvērt MethodMindDrīzumāVideoDrīzumāDownload slides

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Method map

The neighbourhood of related methods — select a node to explore.

Mācīšanās ar pastiprinājumu

Metodes ar politikas gra…Atkārtotais neironu tīkls Dinamiskā programmēšana…Beijesiskā dinamiskā pro…Skaidrojama pastiprināju…Saskaņotā pastiprinātās…Daudzvalodu pastiprināju…Multimodālā pastiprināša…Pašuzraudzītā pastiprinā…Pusuzraudzītā pastiprinā…

+2 more

Avoti

Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
Mnih, V., Kavukcuoglu, K., Silver, D., et al. (2015). Human-level control through deep reinforcement learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗

Kā citēt šo lapu

ScholarGate. (2026, June 3). Reinforcement Learning (Agent-Environment Reward Optimization). ScholarGate. https://scholargate.app/lv/deep-learning/reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Metodes ar politikas gradientuMašīnmācīšanās↔ compare
Atkārtotais neironu tīklsDziļā mācīšanās↔ compare

Compare side by side →

Uz to atsaucas

Dinamiskā programmēšana aģentu vidē Beijesiskā dinamiskā programmēšana Skaidrojama pastiprinājuma mācīšanās Saskaņotā pastiprinātās mācīšanās (Fine-Tuned Reinforcement Learning)Daudzvalodu pastiprinājuma mācīšanās Multimodālā pastiprināšanas mācīšanās Pašuzraudzītā pastiprinātā mācīšanās Pusuzraudzītā pastiprinājuma mācīšanās Pārneses mācīšanās ar pastiprinājuma mācīšanos Vāji uzraudzīta pastiprināšanās apmācība

Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →