Swin Transformer
O Swin Transformer é um transformer visual hierárquico introduzido por Liu et al. em 2021 que utiliza atenção em janelas deslocadas (shifted window attention) para alcançar eficiência computacional, mantendo forte desempenho em tarefas de visão computacional. Diferentemente do Vision Transformer original, que aplica autoatenção global, o Swin usa atenção local baseada em janelas com deslocamento periódico para balancear expressividade e eficiência.
Leia o método completo
Entre com uma conta gratuita para ler esta seção.
Method map
The neighbourhood of related methods — select a node to explore.
Fontes
- Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986 ↗
Como citar esta página
ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/pt/deep-learning/swin-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- DETR (Detection Transformer)Aprendizado profundo↔ compare
- Autoencoders MascaradosAprendizado profundo↔ compare
- Vision MambaAprendizado profundo↔ compare
- Vision TransformerAprendizado profundo↔ compare
Referenciado por
Encontrou um problema nesta página? Relate ou sugira uma correção →