ویژن مامبا
ویژن مامبا یک رویکرد کارآمد مدل فضای حالت برای درک تصویر است که در سال ۲۰۲۴ معرفی شد و مامبا، یک مدل توالی با پیچیدگی خطی، را با بینایی کامپیوتر تطبیق میدهد. ویژن مامبا با بازتعریف توکنهای تصویر به عنوان توالی و استفاده از مدلهای فضای حالت، به دقت رقابتی با ترنسفورمرها دست مییابد، در حالی که پیچیدگی محاسباتی خطی خود را حفظ میکند.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
منابع
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/fa/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- مامبا (مدل فضای حالت)یادگیری عمیق↔ compare
- شبکههای کانولوشن گرافی فضایی-زمانییادگیری عمیق↔ compare
- ترنسفورمر سوین (Swin Transformer)یادگیری عمیق↔ compare
- ترنسفورمر بینایییادگیری عمیق↔ compare
ارجاعشده در
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →