Swin Transformer
Lo Swin Transformer è un "vision transformer" gerarchico introdotto da Liu et al. nel 2021 che utilizza l'attenzione a finestra spostata ("shifted window attention") per ottenere efficienza computazionale mantenendo prestazioni elevate nei compiti di visione artificiale. A differenza del Vision Transformer originale, che applica l'auto-attenzione globale, Swin utilizza l'attenzione locale basata su finestre con spostamento periodico per bilanciare espressività ed efficienza.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
Fonti
- Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986 ↗
Come citare questa pagina
ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/it/deep-learning/swin-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- DETR (Detection Transformer)Apprendimento profondo↔ compare
- Autoencoder MascheratiApprendimento profondo↔ compare
- Vision MambaApprendimento profondo↔ compare
- Vision TransformerApprendimento profondo↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →