Skaidrojams vizuālais transformers
Skaidrojamais vizuālais transformers (Explainable Vision Transformer) apvieno Vision Transformers (ViT) spēcīgo attēlu atpazīšanas veiktspēju ar atribūtu tehnikām — piemēram, atbilstības izplatīšanu (relevance propagation), uzmanības izvēršanu (attention rollout) vai ar gradientu svērto uzmanību (gradient-weighted attention) — kas izceļ, kuri attēla reģioni ir noteicoši katrai prognozei. Šī pieeja ļauj pētniekiem un praktiķiem auditēt modeļu lēmumus un izpildīt caurspīdīguma prasības, nezaudējot precizitāti.
Lasīt pilno metodes aprakstu
Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.
Method map
The neighbourhood of related methods — select a node to explore.
Avoti
- Chefer, H., Gur, S., & Wolf, L. (2021). Transformer interpretability beyond attention visualization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 782–791. DOI: 10.1109/CVPR46437.2021.00084 ↗
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., … Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR). link ↗
Kā citēt šo lapu
ScholarGate. (2026, June 3). Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution). ScholarGate. https://scholargate.app/lv/deep-learning/explainable-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Attēlu klasifikācijaDziļā mācīšanās↔ compare
- Daudzmodālais vīzijas transformatorsDziļā mācīšanās↔ compare
- Self-supervised Vision TransformerDziļā mācīšanās↔ compare
- Semantiskā segmentācijaDziļā mācīšanās↔ compare
- Vision TransformerDziļā mācīšanās↔ compare
Uz to atsaucas
Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →