Swin Transformer
El Swin Transformer es un transformador de visión jerárquico introducido por Liu et al. en 2021 que utiliza atención de ventana desplazada para lograr eficiencia computacional manteniendo un rendimiento sólido en tareas de visión por computadora. A diferencia del Vision Transformer original, que aplica autoatención global, Swin utiliza atención local basada en ventanas con desplazamiento periódico para equilibrar expresividad y eficiencia.
Leer el método completo
Inicia sesión con una cuenta gratuita para leer esta sección.
Method map
The neighbourhood of related methods — select a node to explore.
Fuentes
- Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986 ↗
Cómo citar esta página
ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/es/deep-learning/swin-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- DETR (Detection Transformer)Aprendizaje profundo↔ compare
- Autoencoders enmascaradosAprendizaje profundo↔ compare
- Visión MambaAprendizaje profundo↔ compare
- Vision TransformerAprendizaje profundo↔ compare
Citado por
¿Has visto un problema en esta página? Infórmanos o sugiere una corrección →