Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba 2024 में प्रस्तुत की गई एक कुशल स्टेट स्पेस मॉडल (state space model) विधि है जो छवि समझ (image understanding) के लिए है। यह Mamba, जो कि एक लीनियर-कॉम्प्लेक्सिटी (linear-complexity) अनुक्रम मॉडल (sequence model) है, को कंप्यूटर विजन (computer vision) के अनुकूल बनाती है। छवि टोकन (image tokens) को अनुक्रमों के रूप में पुनर्गठित करके और स्टेट स्पेस मॉडल का उपयोग करके, Vision Mamba ट्रांसफार्मर (transformers) के साथ प्रतिस्पर्धी सटीकता प्राप्त करता है, जबकि लीनियर कम्प्यूटेशनल कॉम्प्लेक्सिटी (linear computational complexity) बनाए रखता है।

MethodMind में खोलेंजल्द हीवीडियोजल्द हीDownload slides

पूरी विधि पढ़ें

केवल सदस्यों के लिए

यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।

साइन इन करें

Method map

The neighbourhood of related methods — select a node to explore.

Vision Mamba

माम्बा (स्टेट स्पेस मॉडल)स्थानिक-सामयिक ग्राफ़ कन…स्विन् ट्रान्सफॉर्मर विजन ट्रांसफार्मर [MISSING TRANSLATION]N-BEATSx

स्रोत

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

इस पृष्ठ का उद्धरण कैसे दें

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/hi/deep-learning/vision-mamba