Machine learningDeep Learning, State Space Models

ভিশন মাম্বা

ভিশন মাম্বা হলো ২০২৪ সালে প্রবর্তিত চিত্র অনুধাবনের জন্য একটি কার্যকর স্টেট স্পেস মডেল পদ্ধতি যা মাম্বাকে, একটি রৈখিক-জটিলতা সম্পন্ন সিকোয়েন্স মডেল, কম্পিউটার ভিশনে অভিযোজিত করে। চিত্র টোকেনগুলিকে সিকোয়েন্স হিসাবে পুনর্গঠন করে এবং স্টেট স্পেস মডেল ব্যবহার করে, ভিশন মাম্বা ট্রান্সফরমারগুলির সাথে প্রতিযোগিতামূলক নির্ভুলতা অর্জন করে এবং রৈখিক কম্পিউটেশনাল জটিলতা বজায় রাখে।

MethodMind-এ খুলুনশীঘ্রইভিডিওশীঘ্রইDownload slides

পুরো পদ্ধতিটি পড়ুন

শুধু সদস্যদের জন্য

এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।

সাইন ইন করুন

Method map

The neighbourhood of related methods — select a node to explore.

ভিশন মাম্বা

মাম্বা (স্টেট স্পেস মডেল)স্থানিক-কালিক গ্রাফ কনভল…সুইন ট্রান্সফরমার (Swin…ভিশন ট্রান্সফরমার DETR (ডিটেকশন ট্রান্সফরম…এন-বিটসএক্স

উৎস

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/bn/deep-learning/vision-mamba