Machine learningDeep learning / NLP / CV

یادگیری تقویتی نیمه‌نظارت‌شده

یادگیری تقویتی نیمه‌نظارت‌شده (SSRL) یادگیری تقویتی استاندارد — که در آن عامل از سیگنال‌های پاداش پراکنده یاد می‌گیرد — را با تکنیک‌های نیمه‌نظارت‌شده که ساختار را از تعاملات محیطی بدون برچسب استخراج می‌کنند، ترکیب می‌کند. هدف، بهبود بهره‌وری نمونه و تعمیم‌پذیری در زمانی است که بازخورد پاداش پرهزینه، با تأخیر، یا فقط برای کسری از تجربه عامل در دسترس باشد.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

منابع

  1. Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link
  2. Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/fa/deep-learning/semi-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ارجاع‌شده در

ScholarGateSemi-supervised Reinforcement Learning (Semi-supervised Reinforcement Learning (SSRL)). بازیابی‌شده در 2026-06-15 از https://scholargate.app/fa/deep-learning/semi-supervised-reinforcement-learning · مجموعه‌داده: https://doi.org/10.5281/zenodo.20539026