Machine learningDeep learning / NLP / CV

למידת חיזוק רב-אופנית

למידת חיזוק רב-אופנית (Multimodal Reinforcement Learning) מאמנת סוכנים לבצע החלטות סדרתיות על ידי תפיסה ושילוב של מספר אופני קלט — כגון פיקסלים גולמיים, הוראות שפה, שמע וחיישנים פרופריוצפטיביים — בו-זמנית. במקום לפעול על זרם נתונים יחיד, הסוכן ממזג אותות הטרוגניים לייצוג מצב מאוחד ולומד מדיניות באמצעות משוב חיזוקי מהסביבה.

פתיחה ב-MethodMindבקרובוידאובקרובDownload slides

קראו את השיטה במלואה

לחברים בלבד

התחברו עם חשבון חינמי כדי לקרוא חלק זה.

התחברות

Method map

The neighbourhood of related methods — select a node to explore.

מקורות

  1. Reed, S., Zolna, K., Parisotto, E., Colmenarejo, S. G., Novikov, A., Barth-Maron, G., ... & de Freitas, N. (2022). A Generalist Agent. Transactions on Machine Learning Research. link
  2. Multimodal learning. Wikipedia. link

איך לצטט עמוד זה

ScholarGate. (2026, June 3). Multimodal Reinforcement Learning (Multi-Sensory RL Agent Learning). ScholarGate. https://scholargate.app/he/deep-learning/multimodal-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultimodal Reinforcement Learning (Multimodal Reinforcement Learning (Multi-Sensory RL Agent Learning)). אוחזר בתאריך 2026-06-15 מתוך https://scholargate.app/he/deep-learning/multimodal-reinforcement-learning · מערך נתונים: https://doi.org/10.5281/zenodo.20539026