ScholarGate
Trợ lý
Machine learningDeep Learning, State Space Models

Vision Mamba

Vision Mamba là một phương pháp mô hình không gian trạng thái hiệu quả cho việc hiểu hình ảnh, được giới thiệu vào năm 2024, điều chỉnh Mamba, một mô hình tuần tự có độ phức tạp tuyến tính, cho thị giác máy tính. Bằng cách diễn giải lại các token hình ảnh dưới dạng chuỗi và sử dụng các mô hình không gian trạng thái, Vision Mamba đạt được độ chính xác cạnh tranh với các mô hình transformer trong khi vẫn duy trì độ phức tạp tính toán tuyến tính.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/vi/deep-learning/vision-mamba

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateVision Mamba (Vision Mamba: Efficient State Space Models for Image Understanding). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/deep-learning/vision-mamba · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026