Machine learningDeep learning / NLP / CV

محوّل الرؤية المُشرف عليه ضعيفًا

يُدرِّب محوّل الرؤية المُشرف عليه ضعيفًا (WS-ViT) محوّل رؤية على بيانات صور تفتقر إلى تعليقات توضيحية دقيقة على مستوى البكسل، وبدلاً من ذلك يستخدم إشرافًا أرخص وأكثر ضوضاءً مثل علامات الفئة على مستوى الصورة، أو مربعات التحديد، أو النصوص المجمعة من الويب. تجعل آلية الانتباه الذاتي الشامل للمحوّل منه قادرًا بشكل خاص على تحديد مواقع الكائنات وتعلم الميزات التمييزية من هذه التسميات غير المكتملة.

افتح في MethodMindقريبًافيديوقريبًاDownload slides

اقرأ الطريقة كاملة

للأعضاء فقط

سجّل الدخول بحساب مجاني لقراءة هذا القسم.

تسجيل الدخول

Method map

The neighbourhood of related methods — select a node to explore.

المصادر

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link
  2. Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106

كيف تستشهد بهذه الصفحة

ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/ar/deep-learning/weakly-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateWeakly supervised vision transformer (Weakly Supervised Vision Transformer (WS-ViT)). استُرجع بتاريخ 2026-06-15 من https://scholargate.app/ar/deep-learning/weakly-supervised-vision-transformer · مجموعة البيانات: https://doi.org/10.5281/zenodo.20539026