Machine learningDeep learning / NLP / CV
التعلم المعزز ضعيف الإشراف
يدرب التعلم المعزز ضعيف الإشراف (WSRL) الوكلاء في بيئات تكون فيها إشارة المكافأة غير مثالية، أو متفرقة، أو متأخرة، أو غير كافية فقط — على عكس التعلم المعزز الكثيف كامل الإشراف. يجب على الوكيل تعلم سياسات فعالة على الرغم من التغذية الراجعة غير المكتملة، باستخدام إشارات مساعدة، أو نمذجة المكافأة، أو تعلم التفضيلات للتعويض عن الإشراف الضعيف.
اقرأ الطريقة كاملة
للأعضاء فقط
تسجيل الدخولسجّل الدخول بحساب مجاني لقراءة هذا القسم.
Method map
The neighbourhood of related methods — select a node to explore.
المصادر
- Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
- Christiano, P., Leike, J., Brown, T. B., Martic, M., Legg, S. & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems (NeurIPS), 30. link ↗
كيف تستشهد بهذه الصفحة
ScholarGate. (2026, June 3). Weakly Supervised Reinforcement Learning. ScholarGate. https://scholargate.app/ar/deep-learning/weakly-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- التعلم المعززالتعلم العميق↔ compare
- التعلم المعزز ذاتي الإشرافالتعلم العميق↔ compare
- التعلم المعزز شبه المُشرف (Semi-supervised Reinforcement Learning)التعلم العميق↔ compare