Machine learningDeep learning / NLP / CV
למידת חיזוק מונחית-למחצה
למידת חיזוק מונחית-למחצה (SSRL) משלבת למידת חיזוק סטנדרטית — שבה סוכן לומד מאותות תגמול דלילים — עם טכניקות מונחות-למחצה המחלצות מבנה מאינטראקציות סביבה לא מתויגות. המטרה היא לשפר את יעילות הדגימה וההכללה כאשר משוב התגמול יקר, מושהה, או זמין רק עבור חלק מחוויות הסוכן.
קראו את השיטה במלואה
לחברים בלבד
התחברותהתחברו עם חשבון חינמי כדי לקרוא חלק זה.
מפת שיטות
סביבת השיטות הקרובות — בחרו צומת כדי לחקור.
מקורות
- Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
איך לצטט עמוד זה
ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/he/deep-learning/semi-supervised-reinforcement-learning
איזו שיטה?
הציבו שיטה זו לצד קרובותיה הקרובות וקראו אותן זו לצד זו — הספרייה מניחה את הספרים על השולחן; הבחירה בידיכם.
- למידת חיזוק אדפטיבית לתחום (DARL)למידה עמוקה↔ השוואה
- למידת חיזוקלמידה עמוקה↔ השוואה
- למידת חיזוק בפיקוח-עצמילמידה עמוקה↔ השוואה
- טרנספורמר בלמידה חצי-מפוקחתלמידה עמוקה↔ השוואה
- למידת העברה עם למידת חיזוקלמידה עמוקה↔ השוואה
- למידת חיזוק מפוקחת באופן חלשלמידה עמוקה↔ השוואה