Machine learningDeep learning / NLP / CV

یادگیری تقویتی نیمه‌نظارت‌شده

یادگیری تقویتی نیمه‌نظارت‌شده (SSRL) یادگیری تقویتی استاندارد — که در آن عامل از سیگنال‌های پاداش پراکنده یاد می‌گیرد — را با تکنیک‌های نیمه‌نظارت‌شده که ساختار را از تعاملات محیطی بدون برچسب استخراج می‌کنند، ترکیب می‌کند. هدف، بهبود بهره‌وری نمونه و تعمیم‌پذیری در زمانی است که بازخورد پاداش پرهزینه، با تأخیر، یا فقط برای کسری از تجربه عامل در دسترس باشد.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

یادگیری تقویتی نیمه‌نظارت‌شده

یادگیری تقویتی تطبیقی دا…یادگیری تقویتی یادگیری تقویتی خودنظارتی ترنسفورمر نیمه‌نظارتی یادگیری انتقالی با یادگی…یادگیری تقویتی با نظارت…

منابع

Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/fa/deep-learning/semi-supervised-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

یادگیری تقویتی تطبیقی دامنهیادگیری عمیق↔ compare
یادگیری تقویتییادگیری عمیق↔ compare
یادگیری تقویتی خودنظارتییادگیری عمیق↔ compare
ترنسفورمر نیمه‌نظارتییادگیری عمیق↔ compare
یادگیری انتقالی با یادگیری تقویتییادگیری عمیق↔ compare
یادگیری تقویتی با نظارت ضعیفیادگیری عمیق↔ compare

Compare side by side →

ارجاع‌شده در

یادگیری تقویتی خودنظارتی یادگیری تقویتی با نظارت ضعیف

در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →