Machine learningDeep Learning, State Space Models

วิชันแมมบ้า

วิชันแมมบ้า (Vision Mamba) เป็นแนวทางแบบจำลองปริภูมิสถานะ (state space model) ที่มีประสิทธิภาพสำหรับการทำความเข้าใจภาพ ซึ่งเปิดตัวในปี 2024 โดยดัดแปลงแมมบ้า (Mamba) ซึ่งเป็นแบบจำลองลำดับที่มีความซับซ้อนเชิงเส้น ให้เข้ากับการประมวลผลภาพด้วยคอมพิวเตอร์ ด้วยการปรับเปลี่ยนโทเค็นของภาพให้เป็นลำดับ และใช้แบบจำลองปริภูมิสถานะ วิชันแมมบ้าจึงให้ความแม่นยำที่แข่งขันได้กับทรานส์ฟอร์มเมอร์ (transformers) ขณะที่ยังคงรักษาความซับซ้อนในการคำนวณเชิงเส้นไว้ได้

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

แหล่งอ้างอิง

  1. Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/th/deep-learning/vision-mamba

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ถูกอ้างอิงโดย

ScholarGateVision Mamba (Vision Mamba: Efficient State Space Models for Image Understanding). สืบค้นเมื่อ 2026-06-15 จาก https://scholargate.app/th/deep-learning/vision-mamba · ชุดข้อมูล: https://doi.org/10.5281/zenodo.20539026