ترنسفورمر بینایی نیمهنظارتشده
ترنسفورمر بینایی نیمهنظارتشده (Semi-supervised Vision Transformer) معماری مبتنی بر پچ و خود-توجهی (self-attention) ترنسفورمر بینایی (ViT) را در سناریوهایی که تنها کسری از تصاویر برچسبدار هستند، به کار میگیرد. این رویکرد با بهرهگیری از مجموعههای بزرگ داده بدون برچسب از طریق برچسبزنی کاذب (pseudo-labeling)، تنظیم سازگاری (consistency regularization) یا وظایف پیشمتن خود-نظارتشده (self-supervised pretext tasks) قبل از تنظیم دقیق (fine-tuning) بر روی مجموعه کوچک برچسبدار، عمل میکند. این روش حتی زمانی که تصاویر برچسبدار کمیاب هستند، به دقت نزدیک به نظارتشده دست مییابد.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
منابع
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 12104–12113. link ↗
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Semi-supervised Vision Transformer (Semi-supervised ViT). ScholarGate. https://scholargate.app/fa/deep-learning/semi-supervised-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- ویژن ترنسفورمر تنظیمشده (Fine-Tuned Vision Transformer)یادگیری عمیق↔ compare
- طبقهبندی تصویریادگیری عمیق↔ compare
- ترنسفورمر بینایی خودنظارتییادگیری عمیق↔ compare
- طبقهبندی مبتنی بر BERT نیمهنظارتییادگیری عمیق↔ compare
- شبکه عصبی کانولوشنی نیمهنظارتشدهیادگیری عمیق↔ compare
- ترنسفورمر بینایییادگیری عمیق↔ compare
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →