Vision Transformer
Vizion Transformer (ViT), koji su uveli Dosovitskiy i saradnici 2021. godine, deli sliku na zakrpe fiksne veličine, tretira te zakrpe kao sekvencu i primenjuje mehanizam samopažnje (self-attention) Transformera na klasifikaciju slika. Uz dovoljno podataka za obuku, nadmašuje konvolucione neuralne mreže (CNN).
Pročitajte celu metodu
Prijavite se besplatnim nalogom da biste pročitali ovaj odeljak.
Method map
The neighbourhood of related methods — select a node to explore.
+27 more
Izvori
Kako citirati ovu stranicu
ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/sr/deep-learning/vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Difuzioni modelDuboko učenje↔ compare
- Generativna suparnička mrežaDuboko učenje↔ compare
- Slučajna šumaMašinsko učenje↔ compare
- Support Vector Machine (Klasifikacija)Mašinsko učenje↔ compare
- Varijacioni autoenkoderDuboko učenje↔ compare
Citirana u
Uočili ste grešku na ovoj stranici? Prijavite je ili predložite ispravku →