Vision Transformer
Ο Vision Transformer (ViT), που εισήχθη από τους Dosovitskiy και συνεργάτες το 2021, χωρίζει μια εικόνα σε επιθέματα σταθερού μεγέθους, τα αντιμετωπίζει ως ακολουθία και εφαρμόζει τον μηχανισμό αυτο-προσοχής του Transformer για ταξινόμηση εικόνων. Με επαρκή δεδομένα εκπαίδευσης, ξεπερνά τα συνελικτικά νευρωνικά δίκτυα (CNNs).
Διαβάστε ολόκληρη τη μέθοδο
Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.
Method map
The neighbourhood of related methods — select a node to explore.
+27 more
Πηγές
Πώς να παραπέμψετε σε αυτή τη σελίδα
ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/el/deep-learning/vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Μοντέλο ΔιάχυσηςΒαθιά Μάθηση↔ compare
- Γενετικό Ανταγωνιστικό ΔίκτυοΒαθιά Μάθηση↔ compare
- Τυχαίο ΔάσοςΜηχανική Μάθηση↔ compare
- Μηχανή Υποστήριξης Διανυσμάτων (Ταξινόμηση)Μηχανική Μάθηση↔ compare
- Variational AutoencoderΒαθιά Μάθηση↔ compare
Αναφέρεται από
Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →