Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba är en effektiv metod baserad på tillståndsrumsmodeller för bildförståelse, introducerad 2024. Den anpassar Mamba, en sekvensmodell med linjär komplexitet, till datorseende. Genom att omformulera bildtoken som sekvenser och använda tillståndsrumsmodeller uppnår Vision Mamba konkurrenskraftig noggrannhet jämfört med transformatorer, samtidigt som den bibehåller linjär beräkningskomplexitet.

Öppna i MethodMindSnartVideoSnartDownload slides

Läs hela metoden

Endast för medlemmar

Logga in med ett kostnadsfritt konto för att läsa avsnittet.

Logga in

Method map

The neighbourhood of related methods — select a node to explore.

Vision Mamba

Mamba (tillståndsrumsmod…Spatial-Temporal Graph C…Swin Transformer Vision Transformer DETR (Detection Transfor…N-BEATSx

Källor

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

Så citerar du den här sidan

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/sv/deep-learning/vision-mamba