Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba è un approccio efficiente basato su modelli a spazio degli stati (state space model) per la comprensione delle immagini, introdotto nel 2024, che adatta Mamba, un modello di sequenza a complessità lineare, alla visione artificiale. Riformulando i token delle immagini come sequenze e utilizzando modelli a spazio degli stati, Vision Mamba raggiunge un'accuratezza competitiva con i transformer mantenendo una complessità computazionale lineare.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Vision Mamba

Mamba (Modello a Spazio…Reti Convoluzionali Graf…Swin Transformer Vision Transformer DETR (Detection Transfor…N-BEATSx

Fonti

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

Come citare questa pagina

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/it/deep-learning/vision-mamba