Machine learningDeep Learning, Vision Transformers

Swin Transformer

Swin Transformer là một mô hình transformer phân cấp cho thị giác, được giới thiệu bởi Liu và cộng sự vào năm 2021, sử dụng cơ chế attention cửa sổ dịch chuyển (shifted window attention) để đạt hiệu quả tính toán đồng thời duy trì hiệu suất mạnh mẽ trên các tác vụ thị giác máy tính. Khác với Vision Transformer gốc vốn áp dụng self-attention toàn cục, Swin sử dụng self-attention dựa trên cửa sổ cục bộ với việc dịch chuyển định kỳ để cân bằng giữa khả năng biểu đạt và hiệu quả.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/vi/deep-learning/swin-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateSwin Transformer (Shifted Window Transformer for Vision). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/deep-learning/swin-transformer · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026