Vision Mamba
Vision Mamba là một phương pháp mô hình không gian trạng thái hiệu quả cho việc hiểu hình ảnh, được giới thiệu vào năm 2024, điều chỉnh Mamba, một mô hình tuần tự có độ phức tạp tuyến tính, cho thị giác máy tính. Bằng cách diễn giải lại các token hình ảnh dưới dạng chuỗi và sử dụng các mô hình không gian trạng thái, Vision Mamba đạt được độ chính xác cạnh tranh với các mô hình transformer trong khi vẫn duy trì độ phức tạp tính toán tuyến tính.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., & Wang, X. (2024). Vision Mamba: Efficient state space models for image understanding. In International Conference on Machine Learning. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 3). Vision Mamba: Efficient State Space Models for Image Understanding. ScholarGate. https://scholargate.app/vi/deep-learning/vision-mamba
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Mamba (Mô hình Không gian Trạng thái)Học sâu↔ compare
- Mạng Nơ-ron Tích chập Đồ thị Không-Thời gianHọc sâu↔ compare
- Swin TransformerHọc sâu↔ compare
- Transformer Thị giácHọc sâu↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →