วิชันแมมบ้า
วิชันแมมบ้า (Vision Mamba) เป็นแนวทางแบบจำลองปริภูมิสถานะ (state space model) ที่มีประสิทธิภาพสำหรับการทำความเข้าใจภาพ ซึ่งเปิดตัวในปี 2024 โดยดัดแปลงแมมบ้า (Mamba) ซึ่งเป็นแบบจำลองลำดับที่มีความซับซ้อนเชิงเส้น ให้เข้ากับการประมวลผลภาพด้วยคอมพิวเตอร์ ด้วยการปรับเปลี่ยนโทเค็นของภาพให้เป็นลำดับ และใช้แบบจำลองปริภูมิสถานะ วิชันแมมบ้าจึงให้ความแม่นยำที่แข่งขันได้กับทรานส์ฟอร์มเมอร์ (transformers) ขณะที่ยังคงรักษาความซับซ้อนในการคำนวณเชิงเส้นไว้ได้
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
แหล่งอ้างอิง
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/th/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (แบบจำลองปริภูมิสถานะ)การเรียนรู้เชิงลึก↔ compare
- เครือข่ายคอนโวลูชันกราฟเชิงพื้นที่-เวลาการเรียนรู้เชิงลึก↔ compare
- Swin Transformer (โปรแกรมแปลง Swin)การเรียนรู้เชิงลึก↔ compare
- วิชันทรานส์ฟอร์มเมอร์การเรียนรู้เชิงลึก↔ compare