Machine learningDeep learning / NLP / CV

محوّل الرؤية المُحسَّن بدقة

يُكيِّف محوّل الرؤية المُحسَّن بدقة (Fine-Tuned Vision Transformer) نموذج محوّل رؤية (ViT) كبير مُدرَّب مسبقًا — والذي يقسم الصور إلى رُقَع ذات حجم ثابت ويعالجها عبر طبقات الانتباه الذاتي — لمهمة تصنيف أو تعرف صور جديدة باستخدام مجموعة بيانات مُصنَّفة صغيرة نسبيًا. يحقق دقة متطورة في رؤية الحاسوب من خلال الاستفادة من التمثيلات الغنية المُكتَسَبة أثناء التدريب المسبق واسع النطاق.

افتح في MethodMindقريبًافيديوقريبًاDownload slides

اقرأ الطريقة كاملة

للأعضاء فقط

سجّل الدخول بحساب مجاني لقراءة هذا القسم.

تسجيل الدخول

Method map

The neighbourhood of related methods — select a node to explore.

محوّل الرؤية المُحسَّن بدقة

تصنيف قائم على BERT الشبكة العصبونية الالتفا…تصنيف الصور التجزئة الدلالية محوّل الرؤية محوّل الرؤية المتكيف مع…نموذج الانتشار المضبط بد…الشبكة التوليدية التنافس…تصنيف الصور المضبوط بدقة التجزئة الدلالية المضبوط…

+4 more

المصادر

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗

كيف تستشهد بهذه الصفحة

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/ar/deep-learning/fine-tuned-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

تصنيف قائم على BERTالتعلم العميق↔ compare
الشبكة العصبونية الالتفافية المُحسَّنة بدقةالتعلم العميق↔ compare
تصنيف الصورالتعلم العميق↔ compare
التجزئة الدلاليةالتعلم العميق↔ compare
محوّل الرؤيةالتعلم العميق↔ compare

Compare side by side →

يُستشهد بها في

محوّل الرؤية المتكيف مع المجال الشبكة العصبونية الالتفافية المُحسَّنة بدقة نموذج الانتشار المضبط بدقة الشبكة التوليدية التنافسية المضبطة بدقة تصنيف الصور المضبوط بدقة التجزئة الدلالية المضبوطة بدقة المُحوِّل البصري متعدد الوسائط (Multimodal ViT)محول الرؤية ذاتي الإشراف المحوّل البصري شبه المُشرف عليه التعلم بالنقل لتصنيف الصور

هل لاحظت مشكلة في هذه الصفحة؟ أبلغ عنها أو اقترح تصحيحًا →

اقرأ الطريقة كاملة

Method map

المصادر

كيف تستشهد بهذه الصفحة

طرق ذات صلة

Which method?

يُستشهد بها في