محوّل الرؤية المُحسَّن بدقة
يُكيِّف محوّل الرؤية المُحسَّن بدقة (Fine-Tuned Vision Transformer) نموذج محوّل رؤية (ViT) كبير مُدرَّب مسبقًا — والذي يقسم الصور إلى رُقَع ذات حجم ثابت ويعالجها عبر طبقات الانتباه الذاتي — لمهمة تصنيف أو تعرف صور جديدة باستخدام مجموعة بيانات مُصنَّفة صغيرة نسبيًا. يحقق دقة متطورة في رؤية الحاسوب من خلال الاستفادة من التمثيلات الغنية المُكتَسَبة أثناء التدريب المسبق واسع النطاق.
اقرأ الطريقة كاملة
سجّل الدخول بحساب مجاني لقراءة هذا القسم.
Method map
The neighbourhood of related methods — select a node to explore.
+4 more
المصادر
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
كيف تستشهد بهذه الصفحة
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/ar/deep-learning/fine-tuned-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- تصنيف قائم على BERTالتعلم العميق↔ compare
- الشبكة العصبونية الالتفافية المُحسَّنة بدقةالتعلم العميق↔ compare
- تصنيف الصورالتعلم العميق↔ compare
- التجزئة الدلاليةالتعلم العميق↔ compare
- محوّل الرؤيةالتعلم العميق↔ compare