Swin Transformer
Swin Transformer là một mô hình transformer phân cấp cho thị giác, được giới thiệu bởi Liu và cộng sự vào năm 2021, sử dụng cơ chế attention cửa sổ dịch chuyển (shifted window attention) để đạt hiệu quả tính toán đồng thời duy trì hiệu suất mạnh mẽ trên các tác vụ thị giác máy tính. Khác với Vision Transformer gốc vốn áp dụng self-attention toàn cục, Swin sử dụng self-attention dựa trên cửa sổ cục bộ với việc dịch chuyển định kỳ để cân bằng giữa khả năng biểu đạt và hiệu quả.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986 ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/vi/deep-learning/swin-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- DETR (Detection Transformer)Học sâu↔ compare
- Mô hình Tự mã hóa Che giấuHọc sâu↔ compare
- Vision MambaHọc sâu↔ compare
- Transformer Thị giácHọc sâu↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →