Vision Mamba
Vision Mamba ist ein effizienter State-Space-Model-Ansatz für das Bildverständnis, der 2024 eingeführt wurde und Mamba, ein Sequenzmodell mit linearer Komplexität, an die Computer Vision anpasst. Durch die Umformulierung von Bild-Tokens als Sequenzen und die Verwendung von State-Space-Modellen erreicht Vision Mamba eine wettbewerbsfähige Genauigkeit mit Transformatoren bei gleichzeitiger Beibehaltung linearer Rechenkomplexität.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
Quellen
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/de/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (State Space Model)Deep Learning↔ compare
- Räumlich-zeitliche Graph-FaltungsnetzwerkeDeep Learning↔ compare
- Swin TransformerDeep Learning↔ compare
- Vision TransformerDeep Learning↔ compare
Referenziert von
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →