ScholarGate
دستیار
Machine learningDeep learning / NLP / CV

یادگیری تقویتی چندزبانه

یادگیری تقویتی چندزبانه (Multilingual RL) پارادایم یادگیری تقویتی — عاملی که از طریق تعامل و پاداش یاد می‌گیرد — را به محیط‌هایی که شامل چندین زبان هستند، اعمال می‌کند. عامل باید مشاهدات چندزبانه را تفسیر کند، دستورالعمل‌های بین‌زبانی را دنبال کند، یا سیاست‌های آموزش‌دیده در یک زبان را به زبان‌های هدف جدید تعمیم دهد، که این امر آن را برای مکالمات بین‌زبانی، عامل‌های بازی چندزبانه، و وظایف تصمیم‌گیری ترتیبی مبتنی بر زبان قابل استفاده می‌سازد.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

منابع

  1. Sutton, R. S., & Barto, A. G. (1998). Reinforcement Learning: An Introduction. MIT Press. ISBN: 978-0262193986
  2. Reinforcement learning. Wikipedia. link

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Multilingual Reinforcement Learning (Cross-Lingual RL for NLP and Language Grounding). ScholarGate. https://scholargate.app/fa/deep-learning/multilingual-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Reinforcement Learning (Multilingual Reinforcement Learning (Cross-Lingual RL for NLP and Language Grounding)). بازیابی‌شده در 2026-06-15 از https://scholargate.app/fa/deep-learning/multilingual-reinforcement-learning · مجموعه‌داده: https://doi.org/10.5281/zenodo.20539026