Machine learningDeep learning / NLP / CV

Επιβλεπόμενος Μετασχηματιστής Όρασης (Semi-supervised Vision Transformer)

Ο Επιβλεπόμενος Μετασχηματιστής Όρασης εφαρμόζει την αρχιτεκτονική αυτο-προσοχής βασισμένη σε τμήματα (patches) του ViT σε ρυθμίσεις όπου μόνο ένα κλάσμα των εικόνων φέρει ετικέτες, αξιοποιώντας μεγάλα μη επιβλεπόμενα σώματα δεδομένων μέσω ψευδο-επισημείωσης (pseudo-labeling), κανονικοποίησης συνέπειας (consistency regularization) ή αυτο-επιβλεπόμενων προκαταρκτικών εργασιών (pretext tasks) πριν την τελική ρύθμιση (fine-tuning) στο μικρό επισημειωμένο σύνολο. Αυτή η προσέγγιση επιτυγχάνει ακρίβεια κοντά στην επιβλεπόμενη ακόμη και όταν οι επισημειωμένες εικόνες είναι σπάνιες.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Πηγές

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 12104–12113. link

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Semi-supervised Vision Transformer (Semi-supervised ViT). ScholarGate. https://scholargate.app/el/deep-learning/semi-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateSemi-supervised Vision Transformer (Semi-supervised Vision Transformer (Semi-supervised ViT)). Ανακτήθηκε στις 2026-06-15 από https://scholargate.app/el/deep-learning/semi-supervised-vision-transformer · Σύνολο δεδομένων: https://doi.org/10.5281/zenodo.20539026