Vision Mamba
Vision Mamba este o abordare eficientă bazată pe modelul spațiului de stare pentru înțelegerea imaginilor, introdusă în 2024, care adaptează Mamba, un model de secvență cu complexitate liniară, la viziunea computerizată. Prin reformularea token-urilor de imagine ca secvențe și utilizarea modelelor spațiului de stare, Vision Mamba atinge o precizie competitivă cu transformerele, menținând în același timp o complexitate computațională liniară.
Citește metoda completă
Autentifică-te cu un cont gratuit pentru a citi această secțiune.
Method map
The neighbourhood of related methods — select a node to explore.
Surse
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Cum se citează această pagină
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/ro/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (Model de Spațiu de Stări)Învățare profundă↔ compare
- Rețele neuronale convoluționale grafice spațio-temporaleÎnvățare profundă↔ compare
- Swin TransformerÎnvățare profundă↔ compare
- Vision TransformerÎnvățare profundă↔ compare
Citat de
Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →