Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba ist ein effizienter State-Space-Model-Ansatz für das Bildverständnis, der 2024 eingeführt wurde und Mamba, ein Sequenzmodell mit linearer Komplexität, an die Computer Vision anpasst. Durch die Umformulierung von Bild-Tokens als Sequenzen und die Verwendung von State-Space-Modellen erreicht Vision Mamba eine wettbewerbsfähige Genauigkeit mit Transformatoren bei gleichzeitiger Beibehaltung linearer Rechenkomplexität.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Vision Mamba

Mamba (State Space Model)Räumlich-zeitliche Graph…Swin Transformer Vision Transformer DETR (Detection Transfor…N-BEATSx

Quellen

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

So zitieren Sie diese Seite

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/de/deep-learning/vision-mamba