Machine learningDeep learning / NLP / CV

یادگیری تقویتی چندزبانه

یادگیری تقویتی چندزبانه (Multilingual RL) پارادایم یادگیری تقویتی — عاملی که از طریق تعامل و پاداش یاد می‌گیرد — را به محیط‌هایی که شامل چندین زبان هستند، اعمال می‌کند. عامل باید مشاهدات چندزبانه را تفسیر کند، دستورالعمل‌های بین‌زبانی را دنبال کند، یا سیاست‌های آموزش‌دیده در یک زبان را به زبان‌های هدف جدید تعمیم دهد، که این امر آن را برای مکالمات بین‌زبانی، عامل‌های بازی چندزبانه، و وظایف تصمیم‌گیری ترتیبی مبتنی بر زبان قابل استفاده می‌سازد.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

یادگیری تقویتی چندزبانه

یادگیری تقویتی تنظیم‌شده…تعبیه‌های چندزبانه جمله ترنسفورمر چندزبانه یادگیری تقویتی یادگیری انتقالی با یادگی…

منابع

Sutton, R. S., & Barto, A. G. (1998). Reinforcement Learning: An Introduction. MIT Press. ISBN: 978-0262193986
Reinforcement learning. Wikipedia. link ↗

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Multilingual Reinforcement Learning (Cross-Lingual RL for NLP and Language Grounding). ScholarGate. https://scholargate.app/fa/deep-learning/multilingual-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

یادگیری تقویتی تنظیم‌شده دقیقیادگیری عمیق↔ compare
تعبیه‌های چندزبانه جملهیادگیری عمیق↔ compare
ترنسفورمر چندزبانهیادگیری عمیق↔ compare
یادگیری تقویتییادگیری عمیق↔ compare
یادگیری انتقالی با یادگیری تقویتییادگیری عمیق↔ compare

Compare side by side →

در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →