ScholarGate
עוזר
Machine learningDeep learning / NLP / CV

למידת חיזוק מונחית-למחצה

למידת חיזוק מונחית-למחצה (SSRL) משלבת למידת חיזוק סטנדרטית — שבה סוכן לומד מאותות תגמול דלילים — עם טכניקות מונחות-למחצה המחלצות מבנה מאינטראקציות סביבה לא מתויגות. המטרה היא לשפר את יעילות הדגימה וההכללה כאשר משוב התגמול יקר, מושהה, או זמין רק עבור חלק מחוויות הסוכן.

פתיחה ב-MethodMindבקרובוידאובקרובהורדת מצגת

קראו את השיטה במלואה

לחברים בלבד

התחברו עם חשבון חינמי כדי לקרוא חלק זה.

התחברות

מפת שיטות

סביבת השיטות הקרובות — בחרו צומת כדי לחקור.

מקורות

  1. Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link
  2. Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link

איך לצטט עמוד זה

ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/he/deep-learning/semi-supervised-reinforcement-learning

איזו שיטה?

הציבו שיטה זו לצד קרובותיה הקרובות וקראו אותן זו לצד זו — הספרייה מניחה את הספרים על השולחן; הבחירה בידיכם.

השוואה זה לצד זה

מאוזכר על ידי

ScholarGateSemi-supervised Reinforcement Learning (Semi-supervised Reinforcement Learning (SSRL)). אוחזר בתאריך 2026-06-15 מתוך https://scholargate.app/he/deep-learning/semi-supervised-reinforcement-learning · מערך נתונים: https://doi.org/10.5281/zenodo.20539026