یادگیری تقویتی چندزبانه
یادگیری تقویتی چندزبانه (Multilingual RL) پارادایم یادگیری تقویتی — عاملی که از طریق تعامل و پاداش یاد میگیرد — را به محیطهایی که شامل چندین زبان هستند، اعمال میکند. عامل باید مشاهدات چندزبانه را تفسیر کند، دستورالعملهای بینزبانی را دنبال کند، یا سیاستهای آموزشدیده در یک زبان را به زبانهای هدف جدید تعمیم دهد، که این امر آن را برای مکالمات بینزبانی، عاملهای بازی چندزبانه، و وظایف تصمیمگیری ترتیبی مبتنی بر زبان قابل استفاده میسازد.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
منابع
- Sutton, R. S., & Barto, A. G. (1998). Reinforcement Learning: An Introduction. MIT Press. ISBN: 978-0262193986
- Reinforcement learning. Wikipedia. link ↗
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Multilingual Reinforcement Learning (Cross-Lingual RL for NLP and Language Grounding). ScholarGate. https://scholargate.app/fa/deep-learning/multilingual-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- یادگیری تقویتی تنظیمشده دقیقیادگیری عمیق↔ compare
- تعبیههای چندزبانه جملهیادگیری عمیق↔ compare
- ترنسفورمر چندزبانهیادگیری عمیق↔ compare
- یادگیری تقویتییادگیری عمیق↔ compare
- یادگیری انتقالی با یادگیری تقویتییادگیری عمیق↔ compare
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →