Vision Mamba
Vision Mamba är en effektiv metod baserad på tillståndsrumsmodeller för bildförståelse, introducerad 2024. Den anpassar Mamba, en sekvensmodell med linjär komplexitet, till datorseende. Genom att omformulera bildtoken som sekvenser och använda tillståndsrumsmodeller uppnår Vision Mamba konkurrenskraftig noggrannhet jämfört med transformatorer, samtidigt som den bibehåller linjär beräkningskomplexitet.
Läs hela metoden
Logga in med ett kostnadsfritt konto för att läsa avsnittet.
Method map
The neighbourhood of related methods — select a node to explore.
Källor
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Så citerar du den här sidan
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/sv/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (tillståndsrumsmodell)Djupinlärning↔ compare
- Spatial-Temporal Graph Convolutional NetworksDjupinlärning↔ compare
- Swin TransformerDjupinlärning↔ compare
- Vision TransformerDjupinlärning↔ compare
Refereras av
Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →