Machine learningDeep learning / NLP / CV

Επεξηγήσιμος Μετασχηματιστής Όρασης

Ο Επεξηγήσιμος Μετασχηματιστής Όρασης (Explainable Vision Transformer - XViT) συνδυάζει την ισχυρή απόδοση αναγνώρισης εικόνων των Μετασχηματιστών Όρασης (Vision Transformers - ViT) με τεχνικές απόδοσης (attribution techniques) — όπως διάδοση σχετικότητας (relevance propagation), αναδίπλωση προσοχής (attention rollout) ή προσοχή σταθμισμένη με κλίση (gradient-weighted attention) — που τονίζουν ποιες περιοχές της εικόνας οδηγούν κάθε πρόβλεψη. Η προσέγγιση επιτρέπει σε ερευνητές και επαγγελματίες να ελέγχουν τις αποφάσεις του μοντέλου και να ικανοποιούν απαιτήσεις διαφάνειας χωρίς να θυσιάζουν την ακρίβεια.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Επεξηγήσιμος Μετασχηματιστής Όρασης

Κατηγοριοποίηση Εικόνων Multimodal Vision Transf…Μετασχηματιστής Όρασης Α…Σημασιολογική Τμηματοποί…Vision Transformer Επεξηγήσιμο Μοντέλο Διάχ…Επεξηγήσιμη Τμηματοποίησ…Επεξηγήσιμη Ανίχνευση Αν…

Πηγές

Chefer, H., Gur, S., & Wolf, L. (2021). Transformer interpretability beyond attention visualization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 782–791. DOI: 10.1109/CVPR46437.2021.00084 ↗
Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., … Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR). link ↗

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution). ScholarGate. https://scholargate.app/el/deep-learning/explainable-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Κατηγοριοποίηση ΕικόνωνΒαθιά Μάθηση↔ compare
Multimodal Vision TransformerΒαθιά Μάθηση↔ compare
Μετασχηματιστής Όρασης Αυτο-εποπτευόμενοςΒαθιά Μάθηση↔ compare
Σημασιολογική ΤμηματοποίησηΒαθιά Μάθηση↔ compare
Vision TransformerΒαθιά Μάθηση↔ compare

Compare side by side →

Αναφέρεται από

Επεξηγήσιμο Μοντέλο Διάχυσης Επεξηγήσιμη Τμηματοποίηση Αντικειμένων Επεξηγήσιμη Ανίχνευση Αντικειμένων

Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →