Machine learningDeep learning / NLP / CV

Обясним Vision Transformer

Обяснимият Vision Transformer съчетава високата производителност при разпознаване на изображения на Vision Transformers (ViT) с техники за приписване — като разпространение на релевантност, разгръщане на вниманието (attention rollout) или градиентно-претеглено внимание — които подчертават кои области на изображението обуславят всяко предсказание. Този подход позволява на изследователите и практиците да одитират решенията на модела и да удовлетворяват изискванията за прозрачност, без да жертват точността.

Отворете в MethodMindСкороВидеоСкороDownload slides

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Method map

The neighbourhood of related methods — select a node to explore.

Обясним Vision Transformer

Класификация на изображе…Мултимодален Вижън Транс…Трансформер за зрение съ…Semantic Segmentation Vision Transformer Обясним дифузионен модел Обяснима сегментация на…Обяснимо детекция на обе…

Източници

Chefer, H., Gur, S., & Wolf, L. (2021). Transformer interpretability beyond attention visualization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 782–791. DOI: 10.1109/CVPR46437.2021.00084 ↗
Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., … Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR). link ↗

Как да цитирате тази страница

ScholarGate. (2026, June 3). Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution). ScholarGate. https://scholargate.app/bg/deep-learning/explainable-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Класификация на изображенияДълбоко обучение↔ compare
Мултимодален Вижън ТрансформърДълбоко обучение↔ compare
Трансформер за зрение със самообучениеДълбоко обучение↔ compare
Semantic SegmentationДълбоко обучение↔ compare
Vision TransformerДълбоко обучение↔ compare

Compare side by side →

Цитиран в

Обясним дифузионен модел Обяснима сегментация на инстанции Обяснимо детекция на обекти

Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →