Machine learningDeep Learning, State Space Models

วิชันแมมบ้า

วิชันแมมบ้า (Vision Mamba) เป็นแนวทางแบบจำลองปริภูมิสถานะ (state space model) ที่มีประสิทธิภาพสำหรับการทำความเข้าใจภาพ ซึ่งเปิดตัวในปี 2024 โดยดัดแปลงแมมบ้า (Mamba) ซึ่งเป็นแบบจำลองลำดับที่มีความซับซ้อนเชิงเส้น ให้เข้ากับการประมวลผลภาพด้วยคอมพิวเตอร์ ด้วยการปรับเปลี่ยนโทเค็นของภาพให้เป็นลำดับ และใช้แบบจำลองปริภูมิสถานะ วิชันแมมบ้าจึงให้ความแม่นยำที่แข่งขันได้กับทรานส์ฟอร์มเมอร์ (transformers) ขณะที่ยังคงรักษาความซับซ้อนในการคำนวณเชิงเส้นไว้ได้

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

วิชันแมมบ้า

Mamba (แบบจำลองปริภูมิสถ…เครือข่ายคอนโวลูชันกราฟเ…Swin Transformer (โปรแกร…วิชันทรานส์ฟอร์มเมอร์DETR (Detection Transfor…N-BEATSx

แหล่งอ้างอิง

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/th/deep-learning/vision-mamba