Vision Mamba
Vision Mamba je učinkovit pristup temeljen na modelu prostora stanja za razumijevanje slika, predstavljen 2024. godine, koji prilagođava Mambu, model niza linearne složenosti, računalnom vidu. Preformuliranjem slikovnih tokena kao nizova i korištenjem modela prostora stanja, Vision Mamba postiže konkurentnu točnost s transformerima, zadržavajući linearnu računalnu složenost.
Pročitajte cijelu metodu
Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.
Method map
The neighbourhood of related methods — select a node to explore.
Izvori
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/hr/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (model prostora stanja)Duboko učenje↔ compare
- Prostorno-vremenske konvolucijske mreže na grafovimaDuboko učenje↔ compare
- Swin TransformerDuboko učenje↔ compare
- Vision TransformerDuboko učenje↔ compare
Citirana u
Uočili ste pogrešku na ovoj stranici? Prijavite je ili predložite ispravak →