ScholarGate
Асистент

Порівняння методів

Переглядайте обрані методи поруч; рядки з відмінностями підсвічено.

Пояснюване навчання з підкріпленням×Навчання з підкріпленням×
ГалузьГлибоке навчанняГлибоке навчання
РодинаMachine learningMachine learning
Рік появи2018–20201950s–1998
Автор методуPuiutta, E. & Veith, E. M. S. P. (survey); broader XAI communitySutton, R. S. & Barto, A. G. (formalised); Bellman, R. (foundations)
ТипHybrid approach (RL + explainability methods)Sequential decision-making framework
Основоположне джерелоPuiutta, E., & Veith, E. M. S. P. (2020). Explainable Reinforcement Learning: A Survey. In Machine Learning and Knowledge Extraction (CD-MAKE 2020), Lecture Notes in Computer Science, vol. 12279, pp. 77–95. Springer. DOI ↗Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
Інші назвиXRL, interpretable reinforcement learning, transparent RL, explainable RLRL, reward-based learning, trial-and-error learning, policy optimization
Пов'язані32
ПідсумокExplainable Reinforcement Learning (XRL) augments standard reinforcement learning agents with methods that make their policies, decisions, and learned behaviors interpretable to humans. Rather than treating the policy as a black box, XRL produces post-hoc explanations or builds inherently transparent policies, enabling trust verification, debugging, and accountability in high-stakes automated decision-making.Reinforcement Learning (RL) is a framework in which an agent learns to make sequential decisions by interacting with an environment, receiving scalar reward signals, and updating a policy to maximise cumulative future reward. Unlike supervised learning, no labeled examples are provided; the agent discovers optimal behavior entirely through experience and delayed feedback.
ScholarGateНабір даних
  1. v1
  2. 2 Джерела
  3. PUBLISHED
  1. v1
  2. 2 Джерела
  3. PUBLISHED

Перейти до пошуку Завантажити слайди

ScholarGateПорівняння методів: Explainable Reinforcement Learning · Reinforcement Learning. Отримано 2026-06-15 з https://scholargate.app/uk/compare