Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba là một phương pháp mô hình không gian trạng thái hiệu quả cho việc hiểu hình ảnh, được giới thiệu vào năm 2024, điều chỉnh Mamba, một mô hình tuần tự có độ phức tạp tuyến tính, cho thị giác máy tính. Bằng cách diễn giải lại các token hình ảnh dưới dạng chuỗi và sử dụng các mô hình không gian trạng thái, Vision Mamba đạt được độ chính xác cạnh tranh với các mô hình transformer trong khi vẫn duy trì độ phức tạp tính toán tuyến tính.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Vision Mamba

Mamba (Mô hình Không gia…Mạng Nơ-ron Tích chập Đồ…Swin Transformer Transformer Thị giác DETR (Detection Transfor…N-BEATSx

Nguồn tài liệu

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/vi/deep-learning/vision-mamba