Vision Mamba
Vision Mamba е ефективен подход, базиран на модели на състоянието (state space models), за разбиране на изображения, представен през 2024 г., който адаптира Mamba, модел за последователности с линейна сложност, към компютърното зрение. Чрез преформулиране на токените на изображенията като последователности и използване на модели на състоянието, Vision Mamba постига конкурентна точност спрямо трансформърите, като същевременно поддържа линейна изчислителна сложност.
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Method map
The neighbourhood of related methods — select a node to explore.
Източници
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Как да цитирате тази страница
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/bg/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (модел с отворено състояние)Дълбоко обучение↔ compare
- Пространствено-времеви конволюционни мрежи върху графиДълбоко обучение↔ compare
- Swin TransformerДълбоко обучение↔ compare
- Vision TransformerДълбоко обучение↔ compare
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →