ScholarGate
Βοηθός
Machine learningDeep learning / NLP / CV

Επεξηγήσιμος Μετασχηματιστής Όρασης

Ο Επεξηγήσιμος Μετασχηματιστής Όρασης (Explainable Vision Transformer - XViT) συνδυάζει την ισχυρή απόδοση αναγνώρισης εικόνων των Μετασχηματιστών Όρασης (Vision Transformers - ViT) με τεχνικές απόδοσης (attribution techniques) — όπως διάδοση σχετικότητας (relevance propagation), αναδίπλωση προσοχής (attention rollout) ή προσοχή σταθμισμένη με κλίση (gradient-weighted attention) — που τονίζουν ποιες περιοχές της εικόνας οδηγούν κάθε πρόβλεψη. Η προσέγγιση επιτρέπει σε ερευνητές και επαγγελματίες να ελέγχουν τις αποφάσεις του μοντέλου και να ικανοποιούν απαιτήσεις διαφάνειας χωρίς να θυσιάζουν την ακρίβεια.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Πηγές

  1. Chefer, H., Gur, S., & Wolf, L. (2021). Transformer interpretability beyond attention visualization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 782–791. DOI: 10.1109/CVPR46437.2021.00084
  2. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., … Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR). link

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution). ScholarGate. https://scholargate.app/el/deep-learning/explainable-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Αναφέρεται από

ScholarGateExplainable Vision Transformer (Explainable Vision Transformer (XViT / ViT with Post-hoc Attribution)). Ανακτήθηκε στις 2026-06-15 από https://scholargate.app/el/deep-learning/explainable-vision-transformer · Σύνολο δεδομένων: https://doi.org/10.5281/zenodo.20539026