Swin Transformer
De Swin Transformer is een hiërarchische vision transformer, geïntroduceerd door Liu et al. in 2021, die gebruikmaakt van 'shifted window attention' om computationele efficiëntie te bereiken met behoud van sterke prestaties op computer vision-taken. In tegenstelling tot de oorspronkelijke Vision Transformer, die globale self-attention toepast, gebruikt Swin lokale, op vensters gebaseerde attention met periodiek verschuiven om expressiviteit en efficiëntie in evenwicht te brengen.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Method map
The neighbourhood of related methods — select a node to explore.
Bronnen
- Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986 ↗
Deze pagina citeren
ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/nl/deep-learning/swin-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- DETR (Detection Transformer)Deep learning↔ compare
- Masked AutoencodersDeep learning↔ compare
- Vision MambaDeep learning↔ compare
- Transformator voor Visuele WaarnemingDeep learning↔ compare
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →