Vision Mamba
Vision Mamba 2024 में प्रस्तुत की गई एक कुशल स्टेट स्पेस मॉडल (state space model) विधि है जो छवि समझ (image understanding) के लिए है। यह Mamba, जो कि एक लीनियर-कॉम्प्लेक्सिटी (linear-complexity) अनुक्रम मॉडल (sequence model) है, को कंप्यूटर विजन (computer vision) के अनुकूल बनाती है। छवि टोकन (image tokens) को अनुक्रमों के रूप में पुनर्गठित करके और स्टेट स्पेस मॉडल का उपयोग करके, Vision Mamba ट्रांसफार्मर (transformers) के साथ प्रतिस्पर्धी सटीकता प्राप्त करता है, जबकि लीनियर कम्प्यूटेशनल कॉम्प्लेक्सिटी (linear computational complexity) बनाए रखता है।
पूरी विधि पढ़ें
यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।
Method map
The neighbourhood of related methods — select a node to explore.
स्रोत
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
इस पृष्ठ का उद्धरण कैसे दें
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/hi/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- माम्बा (स्टेट स्पेस मॉडल)गहन अधिगम↔ compare
- स्थानिक-सामयिक ग्राफ़ कनवल्शनल नेटवर्कगहन अधिगम↔ compare
- स्विन् ट्रान्सफॉर्मरगहन अधिगम↔ compare
- विजन ट्रांसफार्मरगहन अधिगम↔ compare