Vision Transformer i Përshtatur (Fine-Tuned Vision Transformer)
Ky model përshtat një model të madh të parë-trajnuar ViT — i cili i ndan imazhet në pjesë me madhësi fikse dhe i përpunon ato përmes shtresave të vetë-vëmendjes — për një detyrë të re klasifikimi ose njohjeje imazhesh duke përdorur një dataset të etiketuar relativisht të vogël. Ai arrin saktësi të nivelit më të lartë në vizionin kompjuterik duke shfrytëzuar përfaqësimet e pasura të mësuara gjatë parë-trajnimin në shkallë të gjerë.
Lexoni metodën e plotë
Hyni me një llogari falas për ta lexuar këtë seksion.
Harta e metodave
Lagjja e metodave të lidhura — zgjidhni një nyje për të eksploruar.
+4 të tjera
Burimet
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
Si ta citoni këtë faqe
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/sq/deep-learning/fine-tuned-vision-transformer
Cila metodë?
Vendoseni këtë metodë pranë të afërmeve të saj më të ngushta dhe lexojini krah për krah — biblioteka i shtron librat mbi tryezë; zgjedhja është e juaja.
- Klasifikimi i bazuar në BERTMësimi i thellë↔ krahaso
- Rrjeti Konvolucional i Stërvitur imëtMësimi i thellë↔ krahaso
- Klasifikimi i imazheveMësimi i thellë↔ krahaso
- Segmentimimi semantikeMësimi i thellë↔ krahaso
- Vision TransformerMësimi i thellë↔ krahaso
Cituar nga
Vutë re një problem në këtë faqe? Raportojeni ose sugjeroni një korrigjim →