Machine learning

Vision Transformer

Ο Vision Transformer (ViT), που εισήχθη από τους Dosovitskiy και συνεργάτες το 2021, χωρίζει μια εικόνα σε επιθέματα σταθερού μεγέθους, τα αντιμετωπίζει ως ακολουθία και εφαρμόζει τον μηχανισμό αυτο-προσοχής του Transformer για ταξινόμηση εικόνων. Με επαρκή δεδομένα εκπαίδευσης, ξεπερνά τα συνελικτικά νευρωνικά δίκτυα (CNNs).

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Vision Transformer

Μοντέλο Διάχυσης Γενετικό Ανταγωνιστικό Δ…Τυχαίο Δάσος Μηχανή Υποστήριξης Διανυ…Variational Autoencoder Επαναρρύθμιση (Fine-Tuni…CLIP Προσαρμοστικός Μετασχημα…Προσαρμοστικός Μετασχημα…Επεξηγήσιμος Μετασχηματι…

+27 more

Πηγές

Dosovitskiy, A. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. ICLR. link ↗
Touvron, H. et al. (2021). Training Data-Efficient Image Transformers. ICML. link ↗

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/el/deep-learning/vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Μοντέλο ΔιάχυσηςΒαθιά Μάθηση↔ compare
Γενετικό Ανταγωνιστικό ΔίκτυοΒαθιά Μάθηση↔ compare
Τυχαίο ΔάσοςΜηχανική Μάθηση↔ compare
Μηχανή Υποστήριξης Διανυσμάτων (Ταξινόμηση)Μηχανική Μάθηση↔ compare
Variational AutoencoderΒαθιά Μάθηση↔ compare

Compare side by side →

Αναφέρεται από

Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →

Διαβάστε ολόκληρη τη μέθοδο

Method map

Πηγές

Πώς να παραπέμψετε σε αυτή τη σελίδα

Συναφείς μέθοδοι

Which method?

Αναφέρεται από