Machine learning

Deep Reinforcement Learning

Deep Reinforcement Learning kombiniert neuronale Netze mit Reinforcement Learning, sodass ein Agent durch Interaktion mit einer Umgebung lernt. Populär wurde dies durch die Arbeit von Mnih und Kollegen aus dem Jahr 2015 in Nature über die Atari-Steuerung auf menschlichem Niveau. Anstatt aus einem festen, gelabelten Datensatz zu lernen, führt der Agent Aktionen aus, beobachtet Belohnungen und formt schrittweise eine Politik, die den langfristigen Ertrag maximiert.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Deep Reinforcement Learning

Neuronale Architektursuc…Random Forest Rekurrentes neuronales N…XGBoost Differential Evolution Domänenadaptives Reinfor…Dynamische Programmierung Policy-Gradient-Methoden Q-Learning Score-basiertes generati…

Quellen

Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗
Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link ↗

So zitieren Sie diese Seite

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/de/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Neuronale ArchitektursucheDeep Learning↔ compare
Random ForestMaschinelles Lernen↔ compare
Rekurrentes neuronales NetzDeep Learning↔ compare
XGBoostMaschinelles Lernen↔ compare

Compare side by side →

Referenziert von

Differential Evolution Domänenadaptives Reinforcement Learning Dynamische Programmierung Policy-Gradient-Methoden Q-Learning Score-basiertes generatives Modell

Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →

Die vollständige Methode lesen

Method map

Quellen

So zitieren Sie diese Seite

Verwandte Methoden

Which method?

Referenziert von