ScholarGate
Assistente
Machine learningDeep Learning, Vision Transformers

Swin Transformer

Lo Swin Transformer è un "vision transformer" gerarchico introdotto da Liu et al. nel 2021 che utilizza l'attenzione a finestra spostata ("shifted window attention") per ottenere efficienza computazionale mantenendo prestazioni elevate nei compiti di visione artificiale. A differenza del Vision Transformer originale, che applica l'auto-attenzione globale, Swin utilizza l'attenzione locale basata su finestre con spostamento periodico per bilanciare espressività ed efficienza.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Fonti

  1. Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986

Come citare questa pagina

ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/it/deep-learning/swin-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateSwin Transformer (Shifted Window Transformer for Vision). Consultato il 2026-06-15 da https://scholargate.app/it/deep-learning/swin-transformer · Insieme di dati: https://doi.org/10.5281/zenodo.20539026