Vision Mamba
Vision Mamba er en effektiv tilnærming med tilstandsrommodeller for bildeforståelse, introdusert i 2024, som tilpasser Mamba, en sekvensmodell med lineær kompleksitet, til datasyn. Ved å omformulere bildepatcher som sekvenser og bruke tilstandsrommodeller, oppnår Vision Mamba konkurransedyktig nøyaktighet med transformere, samtidig som den opprettholder lineær beregningskompleksitet.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Slik siterer du denne siden
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/no/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (tilstandsromsmodell)Dyp læring↔ compare
- Spatial-Temporal Graph Convolutional NetworksDyp læring↔ compare
- Swin TransformerDyp læring↔ compare
- Vision TransformerDyp læring↔ compare
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →