Machine learningDeep learning / NLP / CV

Megerősítéses tanulás

A megerősítéses tanulás (RL) egy olyan keretrendszer, amelyben egy ügynök interakcióba lépve egy környezettel, skaláris jutalmazási jeleket kapva, szekvenciális döntéshozatalra tanul, és egy politikát frissít a kumulatív jövőbeli jutalom maximalizálása érdekében. A felügyelt tanulással ellentétben nincsenek címkézett példák; az ügynök teljes mértékben tapasztalatok és késleltetett visszajelzések révén fedezi fel az optimális viselkedést.

Megnyitás itt: MethodMindHamarosanVideóHamarosanDownload slides

A teljes módszer elolvasása

Csak tagoknak

Jelentkezzen be ingyenes fiókkal a szakasz elolvasásához.

Bejelentkezés

Method map

The neighbourhood of related methods — select a node to explore.

Megerősítéses tanulás

Grádiens alapú házirend-…Rekurrens neurális hálóz…Agent-based dynamic prog…Bayesian Dynamic Program…Magyarázható megerősítés…Finomhangolt megerősítés…Többnyelvű megerősítéses…Multimodális Reinforceme…Önfeltérképező megerősít…Félfelügyelt megerősítő…

+2 more

Források

Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
Mnih, V., Kavukcuoglu, K., Silver, D., et al. (2015). Human-level control through deep reinforcement learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗

Hogyan hivatkozzon erre az oldalra

ScholarGate. (2026, June 3). Reinforcement Learning (Agent-Environment Reward Optimization). ScholarGate. https://scholargate.app/hu/deep-learning/reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Grádiens alapú házirend-módszerekGépi tanulás↔ compare
Rekurrens neurális hálózatMélytanulás↔ compare

Compare side by side →

Hivatkozik rá

Agent-based dynamic programming Bayesian Dynamic Programming Magyarázható megerősítéses tanulás Finomhangolt megerősítéses tanulás Többnyelvű megerősítéses tanulás Multimodális Reinforcement Learning Önfeltérképező megerősítéses tanulás Félfelügyelt megerősítő tanulás Transzfer Tanulás Reinforcement Learninggel Gyengén felügyelt megerősítéses tanulás

Hibát talált ezen az oldalon? Jelentse, vagy javasoljon javítást →