یادگیری تقویتی تطبیقی دامنه
یادگیری تقویتی تطبیقی دامنه (DARL) یادگیری تقویتی استاندارد را با فعال کردن انتقال و تعمیم مؤثر یک سیاست آموزشدیده در یک محیط یا دامنه به یک دامنه هدف متفاوت اما مرتبط، گسترش میدهد. این روش به مشکل تغییر دامنه - که در آن دینامیکها، مشاهدات یا ساختارهای پاداش بین آموزش و استقرار متفاوت هستند - از طریق تکنیکهای همترازی، انطباق، یا تصادفیسازی دامنه میپردازد و نیاز به جمعآوری تجربه پرهزینه در دامنه هدف را کاهش میدهد.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
منابع
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/fa/deep-learning/domain-adaptive-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- یادگیری تقویتی عمیقیادگیری عمیق↔ compare
- یادگیری انتقالییادگیری ماشین↔ compare
ارجاعشده در
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →