ScholarGate
Assistent
Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba är en effektiv metod baserad på tillståndsrumsmodeller för bildförståelse, introducerad 2024. Den anpassar Mamba, en sekvensmodell med linjär komplexitet, till datorseende. Genom att omformulera bildtoken som sekvenser och använda tillståndsrumsmodeller uppnår Vision Mamba konkurrenskraftig noggrannhet jämfört med transformatorer, samtidigt som den bibehåller linjär beräkningskomplexitet.

Öppna i MethodMindSnartVideoSnartDownload slides

Läs hela metoden

Endast för medlemmar

Logga in med ett kostnadsfritt konto för att läsa avsnittet.

Logga in

Method map

The neighbourhood of related methods — select a node to explore.

Källor

  1. Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link

Så citerar du den här sidan

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/sv/deep-learning/vision-mamba

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Refereras av

ScholarGateVision Mamba (Vision Mamba: Efficient State Space Models for Image Understanding). Hämtad 2026-06-15 från https://scholargate.app/sv/deep-learning/vision-mamba · Datamängd: https://doi.org/10.5281/zenodo.20539026