ScholarGate
Assistent
Machine learning

Deep Reinforcement Learning

Deep Reinforcement Learning kombiniert neuronale Netze mit Reinforcement Learning, sodass ein Agent durch Interaktion mit einer Umgebung lernt. Populär wurde dies durch die Arbeit von Mnih und Kollegen aus dem Jahr 2015 in Nature über die Atari-Steuerung auf menschlichem Niveau. Anstatt aus einem festen, gelabelten Datensatz zu lernen, führt der Agent Aktionen aus, beobachtet Belohnungen und formt schrittweise eine Politik, die den langfristigen Ertrag maximiert.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Quellen

  1. Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236
  2. Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link

So zitieren Sie diese Seite

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/de/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referenziert von

ScholarGateDeep Reinforcement Learning (Deep Reinforcement Learning (DQN / PPO / A3C)). Abgerufen am 2026-06-15 von https://scholargate.app/de/deep-learning/deep-reinforcement-learning · Datensatz: https://doi.org/10.5281/zenodo.20539026