Vision Transformer
Vision Transformer (ViT), i prezantuar nga Dosovitskiy dhe kolegët e tij në vitin 2021, e ndan një imazh në pjesë me madhësi fikse, i trajton ato pjesë si një sekuencë dhe aplikon mekanizmin e vetë-vëmendjes (self-attention) të Transformer për klasifikimin e imazheve. Me mjaftueshëm të dhëna trajnimi, ai tejkalon rrjetet nervore konvolucionale (CNN).
Lexoni metodën e plotë
Hyni me një llogari falas për ta lexuar këtë seksion.
Method map
The neighbourhood of related methods — select a node to explore.
+27 more
Burimet
Si ta citoni këtë faqe
ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/sq/deep-learning/vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Model difuzioniMësimi i thellë↔ compare
- Rrjeti kundërshtar gjeneruesMësimi i thellë↔ compare
- Pylli i RastësishëmMësimi i makinës↔ compare
- Makineria e Vektorëve Mbështetës (Klasifikimi)Mësimi i makinës↔ compare
- Autoenkoderi VarioacionalMësimi i thellë↔ compare
Cituar nga
Vutë re një problem në këtë faqe? Raportojeni ose sugjeroni një korrigjim →