ویژن ترنسفورمر تنظیمشده (Fine-Tuned Vision Transformer)
ویژن ترنسفورمر تنظیمشده، یک مدل بزرگ از پیش آموزشدیده ViT را که تصاویر را به پچهای با اندازه ثابت تقسیم کرده و از طریق لایههای خود-توجه پردازش میکند، با استفاده از مجموعه داده برچسبدار نسبتاً کوچک، برای وظیفه طبقهبندی یا بازشناسی تصویر جدید تطبیق میدهد. این روش با بهرهگیری از بازنماییهای غنی آموختهشده در طول پیشآموزش در مقیاس بزرگ، به دقت پیشرفته (state-of-the-art) در بینایی ماشین دست مییابد.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
+4 more
منابع
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/fa/deep-learning/fine-tuned-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- طبقهبندی مبتنی بر بِرْتیادگیری عمیق↔ compare
- شبکه عصبی کانولوشنی تنظیمشدهیادگیری عمیق↔ compare
- طبقهبندی تصویریادگیری عمیق↔ compare
- تقسیمبندی معنایییادگیری عمیق↔ compare
- ترنسفورمر بینایییادگیری عمیق↔ compare
ارجاعشده در
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →