Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba е ефективен подход, базиран на модели на състоянието (state space models), за разбиране на изображения, представен през 2024 г., който адаптира Mamba, модел за последователности с линейна сложност, към компютърното зрение. Чрез преформулиране на токените на изображенията като последователности и използване на модели на състоянието, Vision Mamba постига конкурентна точност спрямо трансформърите, като същевременно поддържа линейна изчислителна сложност.

Отворете в MethodMindСкороВидеоСкороDownload slides

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Method map

The neighbourhood of related methods — select a node to explore.

Vision Mamba

Mamba (модел с отворено…Пространствено-времеви к…Swin Transformer Vision Transformer DETR (Detection Transfor…N-BEATSx

Източници

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

Как да цитирате тази страница

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/bg/deep-learning/vision-mamba