محوّل الرؤية المُشرف عليه ضعيفًا
يُدرِّب محوّل الرؤية المُشرف عليه ضعيفًا (WS-ViT) محوّل رؤية على بيانات صور تفتقر إلى تعليقات توضيحية دقيقة على مستوى البكسل، وبدلاً من ذلك يستخدم إشرافًا أرخص وأكثر ضوضاءً مثل علامات الفئة على مستوى الصورة، أو مربعات التحديد، أو النصوص المجمعة من الويب. تجعل آلية الانتباه الذاتي الشامل للمحوّل منه قادرًا بشكل خاص على تحديد مواقع الكائنات وتعلم الميزات التمييزية من هذه التسميات غير المكتملة.
اقرأ الطريقة كاملة
سجّل الدخول بحساب مجاني لقراءة هذا القسم.
Method map
The neighbourhood of related methods — select a node to explore.
المصادر
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link ↗
- Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106 ↗
كيف تستشهد بهذه الصفحة
ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/ar/deep-learning/weakly-supervised-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- تقطير المعرفةالتعلم العميق↔ compare
- التعلم ذاتي الإشرافتعلم الآلة↔ compare
- التعلم شبه المُشرفتعلم الآلة↔ compare
- محوّل الرؤيةالتعلم العميق↔ compare