Machine learningDeep learning / NLP / CV

Finjusterad Vision Transformer

Finjusterad Vision Transformer (Fine-Tuned ViT) anpassar en stor förtränad ViT-modell – som delar upp bilder i patchar av fast storlek och bearbetar dem genom självuppmärksamhetslager – till en ny uppgift för bildklassificering eller igenkänning med hjälp av en relativt liten märkt datamängd. Den uppnår toppmodern noggrannhet inom datorseende genom att utnyttja rika representationer som lärts under storskalig förträning.

Öppna i MethodMindSnartVideoSnartLadda ner bildspel

Läs hela metoden

Endast för medlemmar

Logga in med ett kostnadsfritt konto för att läsa avsnittet.

Logga in

Metodkarta

Närområdet av besläktade metoder — välj en nod för att utforska.

Finjusterad Vision Transformer

BERT-baserad klassificer…Finjusterad faltningsnät…Bildklassificering Semantisk segmentering Vision Transformer Domänadaptiv Vision Tran…Finjusterad diffusionsmo…Finjusterat generativt a…Finjusterad bildklassifi…Finjusterad semantisk se…

+4 till

Källor

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗

Så citerar du den här sidan

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/sv/deep-learning/fine-tuned-vision-transformer

Vilken metod?

Placera den här metoden bredvid sina närmaste släktingar och läs dem sida vid sida — biblioteket lägger fram böckerna på bordet; valet är ditt.

BERT-baserad klassificeringDjupinlärning↔ jämför
Finjusterad faltningsnät (CNN)Djupinlärning↔ jämför
BildklassificeringDjupinlärning↔ jämför
Semantisk segmenteringDjupinlärning↔ jämför
Vision TransformerDjupinlärning↔ jämför

Jämför sida vid sida →

Refereras av

Domänadaptiv Vision Transformer Finjusterad faltningsnät (CNN)Finjusterad diffusionsmodell Finjusterat generativt adversariellt nätverk Finjusterad bildklassificering Finjusterad semantisk segmentering Multimodal Vision Transformer Självövervakad Vision Transformer Semi-supervised Vision Transformer Överföringsinlärning med bildklassificering

Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →

Läs hela metoden

Metodkarta

Källor

Så citerar du den här sidan

Närliggande metoder

Vilken metod?

Refereras av