Vision Mamba
Vision Mamba è un approccio efficiente basato su modelli a spazio degli stati (state space model) per la comprensione delle immagini, introdotto nel 2024, che adatta Mamba, un modello di sequenza a complessità lineare, alla visione artificiale. Riformulando i token delle immagini come sequenze e utilizzando modelli a spazio degli stati, Vision Mamba raggiunge un'accuratezza competitiva con i transformer mantenendo una complessità computazionale lineare.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
Fonti
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Come citare questa pagina
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/it/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (Modello a Spazio degli Stati)Apprendimento profondo↔ compare
- Reti Convoluzionali Grafiche Spazio-TemporaliApprendimento profondo↔ compare
- Swin TransformerApprendimento profondo↔ compare
- Vision TransformerApprendimento profondo↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →