ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Häälestatud nägemistransformaator

Häälestatud nägemistransformaator (Fine-Tuned Vision Transformer) kohandab suurt eelnevalt koolitatud ViT-mudelit – mis jagab pildid fikseeritud suurusega tükkideks ja töötleb neid enesetähelepanu kihtide kaudu – uueks pildiklassifitseerimis- või äratundmisülesandeks, kasutades suhteliselt väikest märgistatud andmestikku. See saavutab arvutinägemises tipptasemel täpsuse, kasutades ära suures mahus eelkoolituse käigus õpitud rikkalikke representatsioone.

Ava rakenduses MethodMindPeagiVideoPeagiLaadi slaidid alla

Loe meetodi täielikku kirjeldust

Ainult liikmetele

Selle osa lugemiseks logi sisse tasuta kontoga.

Logi sisse

Meetodikaart

Seotud meetodite ümbruskond — vali sõlm, et seda uurida.

+4 veel

Allikad

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

Kuidas sellele lehele viidata

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/et/deep-learning/fine-tuned-vision-transformer

Milline meetod?

Aseta see meetod oma lähimate sugulaste kõrvale ja loe neid kõrvuti — raamatukogu laob raamatud lauale; valik on sinu.

Võrdle kõrvuti

Sellele viitavad

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). Loetud 2026-06-15 aadressilt https://scholargate.app/et/deep-learning/fine-tuned-vision-transformer · Andmestik: https://doi.org/10.5281/zenodo.20539026