Swin Transformer
Swin Transformer е йерархичен визуален трансформер, представен от Liu et al. през 2021 г., който използва изместено прозоречно внимание за постигане на изчислителна ефективност, като същевременно поддържа силна производителност при задачи за компютърно зрение. За разлика от оригиналния Vision Transformer, който прилага глобално самовнимание, Swin използва локално прозоречно внимание с периодично изместване, за да балансира изразителност и ефективност.
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Карта на методите
Обкръжението на сродните методи — изберете възел, за да го разгледате.
Източници
- Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. In Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 10012-10022). DOI: 10.1109/ICCV48922.2021.00986 ↗
Как да цитирате тази страница
ScholarGate. (2026, June 3). Shifted Window Transformer for Vision. ScholarGate. https://scholargate.app/bg/deep-learning/swin-transformer
Кой метод?
Поставете този метод до най-близките му сродни методи и ги четете едно до друго — библиотеката полага книгите на масата; изборът е ваш.
- DETR (Detection Transformer)Дълбоко обучение↔ сравняване
- Маскирани автоенкодериДълбоко обучение↔ сравняване
- Vision MambaДълбоко обучение↔ сравняване
- Vision TransformerДълбоко обучение↔ сравняване
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →