Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba és un enfocament eficient basat en models d'espai d'estats per a la comprensió d'imatges, introduït el 2024, que adapta Mamba, un model de seqüència de complexitat lineal, a la visió per computador. En reformular els tokens d'imatge com a seqüències i utilitzar models d'espai d'estats, Vision Mamba aconsegueix una precisió competitiva amb els transformers, mantenint alhora una complexitat computacional lineal.

Obre a MethodMindAviatVídeoAviatDownload slides

Llegeix el mètode complet

Només per a membres

Inicia la sessió amb un compte gratuït per llegir aquesta secció.

Inicia la sessió

Method map

The neighbourhood of related methods — select a node to explore.

Fonts

  1. Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link

Com citar aquesta pàgina

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/ca/deep-learning/vision-mamba

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citat per

ScholarGateVision Mamba (Vision Mamba: Efficient State Space Models for Image Understanding). Recuperat el 2026-06-15 de https://scholargate.app/ca/deep-learning/vision-mamba · Conjunt de dades: https://doi.org/10.5281/zenodo.20539026