Vision Mamba
Vision Mamba é uma abordagem eficiente de modelo de espaço de estados para compreensão de imagens, introduzida em 2024, que adapta o Mamba, um modelo de sequência de complexidade linear, para a visão computacional. Ao reformular os tokens de imagem como sequências e usar modelos de espaço de estados, o Vision Mamba alcança precisão competitiva com transformadores, mantendo a complexidade computacional linear.
Leia o método completo
Entre com uma conta gratuita para ler esta seção.
Method map
The neighbourhood of related methods — select a node to explore.
Fontes
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Como citar esta página
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/pt/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (Modelo de Espaço de Estados)Aprendizado profundo↔ compare
- Redes Neurais Convolucionais Espaço-Temporais em GrafosAprendizado profundo↔ compare
- Swin TransformerAprendizado profundo↔ compare
- Vision TransformerAprendizado profundo↔ compare
Referenciado por
Encontrou um problema nesta página? Relate ou sugira uma correção →