Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba er en effektiv state space model-tilgang til billedforståelse, introduceret i 2024, som adapterer Mamba, en sekvensmodel med lineær kompleksitet, til computer vision. Ved at omformulere billedtokens som sekvenser og anvende state space models opnår Vision Mamba konkurrencedygtig nøjagtighed med transformers, samtidig med at den lineære beregningsmæssige kompleksitet bevares.

Åbn i MethodMindSnartVideoSnartDownload slides

Læs hele metoden

Kun for medlemmer

Log ind med en gratis konto for at læse dette afsnit.

Log ind

Method map

The neighbourhood of related methods — select a node to explore.

Vision Mamba

Mamba (State Space Model)Rumlig-tidslige graf-kon…Swin Transformer Vision Transformer DETR (Detection Transfor…N-BEATSx

Kilder

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

Sådan citerer du denne side

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/da/deep-learning/vision-mamba