ScholarGate
Βοηθός
Machine learningDeep Learning, State Space Models

Vision Mamba

Το Vision Mamba είναι μια αποδοτική προσέγγιση μοντέλου χώρου καταστάσεων (state space model) για την κατανόηση εικόνων, που εισήχθη το 2024 και προσαρμόζει το Mamba, ένα μοντέλο ακολουθιών γραμμικής πολυπλοκότητας, στην όραση υπολογιστών. Μετασχηματίζοντας τα διακριτά στοιχεία (tokens) της εικόνας σε ακολουθίες και χρησιμοποιώντας μοντέλα χώρου καταστάσεων, το Vision Mamba επιτυγχάνει ανταγωνιστική ακρίβεια με τα transformers, διατηρώντας παράλληλα γραμμική υπολογιστική πολυπλοκότητα.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Πηγές

  1. Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/el/deep-learning/vision-mamba

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Αναφέρεται από

ScholarGateVision Mamba (Vision Mamba: Efficient State Space Models for Image Understanding). Ανακτήθηκε στις 2026-06-15 από https://scholargate.app/el/deep-learning/vision-mamba · Σύνολο δεδομένων: https://doi.org/10.5281/zenodo.20539026