ScholarGate
Βοηθός
Machine learningDeep learning / NLP / CV

Προσαρμοσμένος Όρασης Μετασχηματιστής

Ο Προσαρμοσμένος Όρασης Μετασχηματιστής (Fine-Tuned Vision Transformer) προσαρμόζει ένα μεγάλο προεκπαιδευμένο μοντέλο ViT — το οποίο χωρίζει εικόνες σε σταθερού μεγέθους τμήματα και τα επεξεργάζεται μέσω επιπέδων αυτο-προσοχής — σε μια νέα εργασία ταξινόμησης ή αναγνώρισης εικόνων χρησιμοποιώντας ένα σχετικά μικρό επισημασμένο σύνολο δεδομένων. Επιτυγχάνει κορυφαία ακρίβεια στην όραση υπολογιστών αξιοποιώντας πλούσιες αναπαραστάσεις που αποκτήθηκαν κατά τη μεγάλης κλίμακας προεκπαίδευση.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαΛήψη διαφανειών

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Χάρτης μεθόδων

Η γειτονιά των σχετιζόμενων μεθόδων — επιλέξτε έναν κόμβο για εξερεύνηση.

+4 ακόμη

Πηγές

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/el/deep-learning/fine-tuned-vision-transformer

Ποια μέθοδος;

Τοποθετήστε αυτή τη μέθοδο δίπλα στις πιο συγγενείς της και διαβάστε τις παράλληλα — η βιβλιοθήκη απλώνει τα βιβλία στο τραπέζι· η επιλογή είναι δική σας.

Συγκρίνετε παράλληλα

Αναφέρεται από

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). Ανακτήθηκε στις 2026-06-15 από https://scholargate.app/el/deep-learning/fine-tuned-vision-transformer · Σύνολο δεδομένων: https://doi.org/10.5281/zenodo.20539026