Machine learning

ترنسفورمر بینایی

ترنسفورمر بینایی (ViT) که توسط دوسوویتسکی و همکارانش در سال ۲۰۲۱ معرفی شد، تصویر را به وصله‌هایی با اندازه ثابت تقسیم می‌کند، آن وصله‌ها را به عنوان یک دنباله در نظر می‌گیرد و از مکانیزم توجه به خود ترنسفورمر برای طبقه‌بندی تصویر استفاده می‌کند. با داده‌های آموزشی کافی، از شبکه‌های عصبی کانولوشنی (CNN) پیشی می‌گیرد.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

ترنسفورمر بینایی

مدل انتشار (Diffusion Mo…شبکه مولد تخاصمی جنگل تصادفی ماشین بردار پشتیبان (طبق…Variational Autoencoder تنظیم دقیق BERT CLIP ترنسفورمر سازگار با دامنه ترانسفورمر بینایی تطبیقی…ترانسفورمر بینایی قابل ت…

+27 more

منابع

Dosovitskiy, A. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. ICLR. link ↗
Touvron, H. et al. (2021). Training Data-Efficient Image Transformers. ICML. link ↗

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/fa/deep-learning/vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

مدل انتشار (Diffusion Model)یادگیری عمیق↔ compare
شبکه مولد تخاصمییادگیری عمیق↔ compare
جنگل تصادفییادگیری ماشین↔ compare
ماشین بردار پشتیبان (طبقه‌بندی)یادگیری ماشین↔ compare
Variational Autoencoderیادگیری عمیق↔ compare

Compare side by side →

ارجاع‌شده در

تنظیم دقیق BERT CLIP ترنسفورمر سازگار با دامنه ترانسفورمر بینایی تطبیقی دامنه ترانسفورمر بینایی قابل توضیح ویژن ترنسفورمر تنظیم‌شده (Fine-Tuned Vision Transformer)تنظیم دقیق GPT طبقه‌بندی تصویر شبکه‌های کولموگروف-آرنولد لورا و PEFT مامبا (مدل فضای حالت)خودرمزگذارِ پوشیده (Masked Autoencoders)Multilingual vision transformer طبقه‌بندی چندوجهی مبتنی بر BERT پردازش زبان طبیعی چندوجهی تقسیم‌بندی معنایی چندوجهی ترانسفورمر چندوجهی ترانسفورمر بینایی چندوجهی مدل قطعه‌بندی هر چیزی (Segment Anything Model - SAM)شبکه مولد تخاصمی خودنظارتی (Self-supervised GAN)طبقه‌بندی تصویر خودنظارتی Self-supervised Instance Segmentation تقسیم‌بندی معنایی خودنظارتی (Self-supervised Semantic Segmentation)ترنسفورمر بینایی خودنظارتی ترنسفورمر بینایی نیمه‌نظارت‌شده سیم‌سی‌ال‌آر (SimCLR)شبکه‌های کانولوشن گرافی فضایی-زمانی ترنسفورمر سوین (Swin Transformer)TimeGPT ویژن مامبا تشخیص اشیاء با نظارت ضعیف ترنسفورمر بینایی تحت نظارت ضعیف

در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →

مطالعهٔ کامل روش

Method map

منابع

نحوهٔ استناد به این صفحه

روش‌های مرتبط

Which method?

ارجاع‌شده در