Vision Transformer בר-הסבר
Vision Transformer בר-הסבר (Explainable Vision Transformer) משלב את ביצועי זיהוי התמונה החזקים של Vision Transformers (ViT) עם טכניקות ייחוס – כגון הפצת רלוונטיות (relevance propagation), גלגול קשב (attention rollout), או קשב משוקלל-גרדיאנט (gradient-weighted attention) – המדגישות אילו אזורי תמונה מניעים כל חיזוי. גישה זו מאפשרת לחוקרים ולמתרגלים לבקר החלטות מודל ולעמוד בדרישות שקיפות מבלי לוותר על דיוק.
קראו את השיטה במלואה
התחברו עם חשבון חינמי כדי לקרוא חלק זה.
Method map
The neighbourhood of related methods — select a node to explore.
מקורות
- Chefer, H., Gur, S., & Wolf, L. (2021). Transformer interpretability beyond attention visualization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 782–791. DOI: 10.1109/CVPR46437.2021.00084 ↗
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., … Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR). link ↗
איך לצטט עמוד זה
ScholarGate. (2026, June 3). Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution). ScholarGate. https://scholargate.app/he/deep-learning/explainable-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- סיווג תמונהלמידה עמוקה↔ compare
- Multimodal Vision Transformerלמידה עמוקה↔ compare
- טרנספורמר ראייה (Vision Transformer) בלמידה עצמיתלמידה עמוקה↔ compare
- סגמנטציה סמנטיתלמידה עמוקה↔ compare
- טרנספורמר ראייהלמידה עמוקה↔ compare