Machine learningDeep learning / NLP / CV

למידת חיזוק מונחית-למחצה

למידת חיזוק מונחית-למחצה (SSRL) משלבת למידת חיזוק סטנדרטית — שבה סוכן לומד מאותות תגמול דלילים — עם טכניקות מונחות-למחצה המחלצות מבנה מאינטראקציות סביבה לא מתויגות. המטרה היא לשפר את יעילות הדגימה וההכללה כאשר משוב התגמול יקר, מושהה, או זמין רק עבור חלק מחוויות הסוכן.

פתיחה ב-MethodMindבקרובוידאובקרובהורדת מצגת

קראו את השיטה במלואה

לחברים בלבד

התחברו עם חשבון חינמי כדי לקרוא חלק זה.

התחברות

מפת שיטות

סביבת השיטות הקרובות — בחרו צומת כדי לחקור.

למידת חיזוק מונחית-למחצה

למידת חיזוק אדפטיבית לתח…למידת חיזוק למידת חיזוק בפיקוח-עצמי טרנספורמר בלמידה חצי-מפו…למידת העברה עם למידת חיז…למידת חיזוק מפוקחת באופן…

מקורות

Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗

איך לצטט עמוד זה

ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/he/deep-learning/semi-supervised-reinforcement-learning

איזו שיטה?

הציבו שיטה זו לצד קרובותיה הקרובות וקראו אותן זו לצד זו — הספרייה מניחה את הספרים על השולחן; הבחירה בידיכם.

למידת חיזוק אדפטיבית לתחום (DARL)למידה עמוקה↔ השוואה
למידת חיזוקלמידה עמוקה↔ השוואה
למידת חיזוק בפיקוח-עצמילמידה עמוקה↔ השוואה
טרנספורמר בלמידה חצי-מפוקחתלמידה עמוקה↔ השוואה
למידת העברה עם למידת חיזוקלמידה עמוקה↔ השוואה
למידת חיזוק מפוקחת באופן חלשלמידה עמוקה↔ השוואה

השוואה זה לצד זה →

מאוזכר על ידי

למידת חיזוק בפיקוח-עצמי למידת חיזוק מפוקחת באופן חלש

מצאתם בעיה בעמוד זה? דווחו או הציעו תיקון →