ScholarGate
Assistente
Machine learningDeep Learning, Vision Transformers

Swin Transformer

O Swin Transformer é um transformer visual hierárquico introduzido por Liu et al. em 2021 que utiliza atenção em janelas deslocadas (shifted window attention) para alcançar eficiência computacional, mantendo forte desempenho em tarefas de visão computacional. Diferentemente do Vision Transformer original, que aplica autoatenção global, o Swin usa atenção local baseada em janelas com deslocamento periódico para balancear expressividade e eficiência.

Abrir no MethodMindEm breveVídeoEm breveDownload slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Method map

The neighbourhood of related methods — select a node to explore.

Fontes

  1. Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986

Como citar esta página

ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/pt/deep-learning/swin-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referenciado por

ScholarGateSwin Transformer (Shifted Window Transformer for Vision). Recuperado em 2026-06-15 de https://scholargate.app/pt/deep-learning/swin-transformer · Conjunto de dados: https://doi.org/10.5281/zenodo.20539026