ScholarGate
Asistents
Machine learningDeep learning / NLP / CV

Pielāgotais Vision Transformer

Pielāgotais Vision Transformer (Fine-Tuned Vision Transformer) pielāgo lielo, iepriekš apmācīto ViT modeli — kas sadala attēlus fiksēta izmēra daļās un apstrādā tās caur pašuzmanības slāņiem — jaunam attēlu klasifikācijas vai atpazīšanas uzdevumam, izmantojot salīdzinoši nelielu marķētu datu kopu. Tas sasniedz visaugstāko precizitāti datorredzē, izmantojot bagātīgas reprezentācijas, kas apgūtas liela mēroga iepriekšējās apmācības laikā.

Atvērt MethodMindDrīzumāVideoDrīzumāLejupielādēt slaidus

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Metožu karte

Saistīto metožu apkaime — atlasiet mezglu, lai izpētītu.

+vēl 4

Avoti

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

Kā citēt šo lapu

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/lv/deep-learning/fine-tuned-vision-transformer

Kura metode?

Novietojiet šo metodi blakus tās tuvākajām radniecīgajām metodēm un lasiet tās līdzās — bibliotēka noliek grāmatas uz galda; izvēle ir jūsu.

Salīdzināt blakus

Uz to atsaucas

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). Izgūts 2026-06-15 no https://scholargate.app/lv/deep-learning/fine-tuned-vision-transformer · Datu kopa: https://doi.org/10.5281/zenodo.20539026