Machine learningDeep learning / NLP / CV

Transformador de Visão Explicável

O Explainable Vision Transformer (Explainable ViT) combina o forte desempenho em reconhecimento de imagens dos Vision Transformers (ViT) com técnicas de atribuição — como propagação de relevância, atenção rollout ou atenção ponderada por gradiente — que destacam quais regiões da imagem impulsionam cada predição. A abordagem permite que pesquisadores e praticantes auditem as decisões do modelo e satisfaçam requisitos de transparência sem sacrificar a precisão.

Abrir no MethodMindEm breveVídeoEm breveDownload slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Method map

The neighbourhood of related methods — select a node to explore.

Transformador de Visão Explicável

Classificação de Imagens Multimodal Vision Transf…Vision Transformer Autos…Segmentação semântica Vision Transformer Modelo de Difusão Explic…Segmentação Explicável d…Detecção Explicável de O…

Fontes

Chefer, H., Gur, S., & Wolf, L. (2021). Transformer interpretability beyond attention visualization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 782–791. DOI: 10.1109/CVPR46437.2021.00084 ↗
Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., … Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR). link ↗

Como citar esta página

ScholarGate. (2026, June 3). Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution). ScholarGate. https://scholargate.app/pt/deep-learning/explainable-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Classificação de ImagensAprendizado profundo↔ compare
Multimodal Vision TransformerAprendizado profundo↔ compare
Vision Transformer AutossupervisionadoAprendizado profundo↔ compare
Segmentação semânticaAprendizado profundo↔ compare
Vision TransformerAprendizado profundo↔ compare

Compare side by side →

Referenciado por

Modelo de Difusão Explicável Segmentação Explicável de Instâncias Detecção Explicável de Objetos

Encontrou um problema nesta página? Relate ou sugira uma correção →