Swin Transformer
Swin Transformer ialah transformer penglihatan (vision transformer) hierarkikal yang diperkenalkan oleh Liu et al. pada tahun 2021 yang menggunakan perhatian tetingkap beralih (shifted window attention) untuk mencapai kecekapan komputasi sambil mengekalkan prestasi yang kukuh pada tugasan penglihatan komputer. Berbeza dengan Vision Transformer asal yang menggunakan perhatian kendiri global (global self-attention), Swin menggunakan perhatian berasaskan tetingkap setempat (local window-based attention) dengan peralihan berkala untuk mengimbangi ekspresiviti dan kecekapan.
Baca kaedah sepenuhnya
Log masuk dengan akaun percuma untuk membaca bahagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
Sumber
- Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986 ↗
Cara memetik halaman ini
ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/ms/deep-learning/swin-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- DETR (Detection Transformer)Pembelajaran Mendalam↔ compare
- Autoenkoder BertopengPembelajaran Mendalam↔ compare
- Vision MambaPembelajaran Mendalam↔ compare
- Transformer VisiPembelajaran Mendalam↔ compare
Dirujuk oleh
Terjumpa masalah pada halaman ini? Laporkan atau cadangkan pembetulan →