Machine learningDeep learning / NLP / CV

Učenje pojačavanjem

Učenje pojačavanjem (RL) je okvir u kojem agent uči donositi sekvencijalne odluke interakcijom s okolinom, primajući skalarne signale nagrade i ažurirajući politiku kako bi maksimizirao kumulativnu buduću nagradu. Za razliku od nadziranog učenja, ne pružaju se označeni primjeri; agent otkriva optimalno ponašanje isključivo kroz iskustvo i odgođenu povratnu informaciju.

Otvorite u MethodMindUskoroVideoUskoroDownload slides

Pročitajte celu metodu

Samo za članove

Prijavite se besplatnim nalogom da biste pročitali ovaj odeljak.

Prijavite se

Method map

The neighbourhood of related methods — select a node to explore.

Učenje pojačavanjem

Metode gradijenta politi…Рекурентна неуронска мре…Agentno-zasnovano dinami…Бајесовско динамичко про…Objašnjivo učenje potkre…Fino podešeno pojačano u…Višejezično pojačano uče…Višestruko modalno mađio…Samostalno nadgledano po…Polunadzirano učenje pot…

+2 more

Izvori

Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
Mnih, V., Kavukcuoglu, K., Silver, D., et al. (2015). Human-level control through deep reinforcement learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗

Kako citirati ovu stranicu

ScholarGate. (2026, June 3). Reinforcement Learning (Agent-Environment Reward Optimization). ScholarGate. https://scholargate.app/sr/deep-learning/reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Metode gradijenta politikeMašinsko učenje↔ compare
Рекурентна неуронска мрежаDuboko učenje↔ compare

Compare side by side →

Citirana u

Agentno-zasnovano dinamičko programiranje Бајесовско динамичко програмирање Objašnjivo učenje potkrepljivanjem Fino podešeno pojačano učenje Višejezično pojačano učenje Višestruko modalno mađioničarsko učenje Samostalno nadgledano pojačano učenje Polunadzirano učenje potkrepljivanjem Transfer Learning with Reinforcement Learning Slabo nadgledano učenje potkrepljenjem

Uočili ste grešku na ovoj stranici? Prijavite je ili predložite ispravku →