Machine learningDeep Learning, State Space Models

Vision Mamba

Το Vision Mamba είναι μια αποδοτική προσέγγιση μοντέλου χώρου καταστάσεων (state space model) για την κατανόηση εικόνων, που εισήχθη το 2024 και προσαρμόζει το Mamba, ένα μοντέλο ακολουθιών γραμμικής πολυπλοκότητας, στην όραση υπολογιστών. Μετασχηματίζοντας τα διακριτά στοιχεία (tokens) της εικόνας σε ακολουθίες και χρησιμοποιώντας μοντέλα χώρου καταστάσεων, το Vision Mamba επιτυγχάνει ανταγωνιστική ακρίβεια με τα transformers, διατηρώντας παράλληλα γραμμική υπολογιστική πολυπλοκότητα.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Vision Mamba

Mamba (Μοντέλο Χώρου Κατ…Χωροχρονικά Συνελικτικά…Swin Transformer Vision Transformer DETR (Detection Transfor…N-BEATSx

Πηγές

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/el/deep-learning/vision-mamba