Machine learningDeep learning / NLP / CV

Vision Transformer con Fine-Tuning

Il Vision Transformer con Fine-Tuning adatta un modello ViT di grandi dimensioni pre-addestrato — che suddivide le immagini in patch di dimensioni fisse e le elabora tramite strati di auto-attenzione — a un nuovo compito di classificazione o riconoscimento di immagini utilizzando un dataset etichettato relativamente piccolo. Raggiunge un'accuratezza all'avanguardia nella visione artificiale sfruttando le ricche rappresentazioni apprese durante il pre-addestramento su larga scala.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Vision Transformer con Fine-Tuning

Classificazione basata s…Convolutional Neural Net…Classificazione di immag…Segmentazione Semantica Vision Transformer Vision Transformer Adatt…Modello a Diffusione Fin…Generative Adversarial N…Classificazione di immag…Segmentazione Semantica…

+4 more

Fonti

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗

Come citare questa pagina

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/it/deep-learning/fine-tuned-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Classificazione basata su BERTApprendimento profondo↔ compare
Convolutional Neural Network Fine-TunedApprendimento profondo↔ compare
Classificazione di immaginiApprendimento profondo↔ compare
Segmentazione SemanticaApprendimento profondo↔ compare
Vision TransformerApprendimento profondo↔ compare

Compare side by side →

Citato da

Vision Transformer Adattivo al Dominio Convolutional Neural Network Fine-Tuned Modello a Diffusione Fine-Tuned Generative Adversarial Network (GAN) Fine-Tuned Classificazione di immagini fine-tuned Segmentazione Semantica Ottimizzata (Fine-Tuned Semantic Segmentation)Vision Transformer Multimodale Vision Transformer Auto-supervisionato Vision Transformer Semi-Supervised Apprendimento per trasferimento con classificazione di immagini

Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →

Leggi il metodo completo

Method map

Fonti

Come citare questa pagina

Metodi correlati

Which method?

Citato da