ScholarGate
Assistente
Machine learningDeep learning / NLP / CV

Vision Transformer con Fine-Tuning

Il Vision Transformer con Fine-Tuning adatta un modello ViT di grandi dimensioni pre-addestrato — che suddivide le immagini in patch di dimensioni fisse e le elabora tramite strati di auto-attenzione — a un nuovo compito di classificazione o riconoscimento di immagini utilizzando un dataset etichettato relativamente piccolo. Raggiunge un'accuratezza all'avanguardia nella visione artificiale sfruttando le ricche rappresentazioni apprese durante il pre-addestramento su larga scala.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

+4 more

Fonti

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

Come citare questa pagina

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/it/deep-learning/fine-tuned-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). Consultato il 2026-06-15 da https://scholargate.app/it/deep-learning/fine-tuned-vision-transformer · Insieme di dati: https://doi.org/10.5281/zenodo.20539026