Machine learning

یادگیری تقویتی عمیق

یادگیری تقویتی عمیق (Deep Reinforcement Learning) شبکه‌های عصبی را با یادگیری تقویتی ترکیب می‌کند تا یک عامل با تعامل با محیط یاد بگیرد؛ این روش با کار برجسته سال ۲۰۱۵ توسط Mnih و همکاران در مجله Nature در مورد کنترل در سطح انسانی بازی‌های آتاری محبوبیت یافت. به جای یادگیری از یک مجموعه داده برچسب‌دار ثابت، عامل دست به اقدام می‌زند، پاداش‌ها را مشاهده می‌کند و به تدریج سیاستی را شکل می‌دهد که بازده بلندمدت را به حداکثر می‌رساند.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

یادگیری تقویتی عمیق

جستجوی معماری عصبی جنگل تصادفی شبکه عصبی بازگشتی XGBoost تکامل تفاضلی یادگیری تقویتی تطبیقی دا…برنامه‌ریزی پویا روش‌های گرادیان خط‌مشی یادگیری کیو (Q-Learning)مدل مولد مبتنی بر امتیاز

منابع

Mnih, V. et al. (2015). Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗
Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. link ↗

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 1). Deep Reinforcement Learning (DQN / PPO / A3C). ScholarGate. https://scholargate.app/fa/deep-learning/deep-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

جستجوی معماری عصبییادگیری عمیق↔ compare
جنگل تصادفییادگیری ماشین↔ compare
شبکه عصبی بازگشتییادگیری عمیق↔ compare
XGBoostیادگیری ماشین↔ compare

Compare side by side →

ارجاع‌شده در

تکامل تفاضلی یادگیری تقویتی تطبیقی دامنه برنامه‌ریزی پویا روش‌های گرادیان خط‌مشی یادگیری کیو (Q-Learning)مدل مولد مبتنی بر امتیاز

در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →

مطالعهٔ کامل روش

Method map

منابع

نحوهٔ استناد به این صفحه

روش‌های مرتبط

Which method?

ارجاع‌شده در