Vision Mamba
Vision Mamba je efektívny prístup založený na stavových priestoroch (state space model) pre porozumenie obrazu, predstavený v roku 2024, ktorý adaptuje Mambu, sekvenčný model s lineárnou zložitosťou, na počítačové videnie. Preformulovaním obrazových tokenov na sekvencie a použitím stavových priestorových modelov dosahuje Vision Mamba konkurencieschopnú presnosť s transformermi pri zachovaní lineárnej výpočtovej zložitosti.
Prečítať celú metódu
Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Ako citovať túto stránku
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/sk/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (model stavového priestoru)Hlboké učenie↔ compare
- Priestorovo-časové grafové konvolučné sieteHlboké učenie↔ compare
- Swin TransformerHlboké učenie↔ compare
- Vision TransformerHlboké učenie↔ compare
Odkazujú sem
Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →