Fijn-afgestelde Vision Transformer
Een Fijn-afgestelde Vision Transformer past een groot vooraf getraind ViT-model — dat beelden opdeelt in patches van vaste grootte en ze verwerkt via self-attention lagen — aan een nieuwe beeldclassificatie- of herkenningstaak aan met behulp van een relatief kleine gelabelde dataset. Het bereikt state-of-the-art nauwkeurigheid in computervisie door rijke representaties te benutten die zijn geleerd tijdens grootschalige pre-training.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Methodenkaart
De omgeving van verwante methoden — selecteer een knooppunt om te verkennen.
+4 meer
Bronnen
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
Deze pagina citeren
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/nl/deep-learning/fine-tuned-vision-transformer
Welke methode?
Plaats deze methode naast haar naaste verwanten en lees ze naast elkaar — de bibliotheek legt de boeken op tafel; de keuze is aan u.
- BERT-gebaseerde ClassificatieDeep learning↔ vergelijken
- Fijn-afgestelde Convolutionele Neurale NetwerkenDeep learning↔ vergelijken
- BeeldclassificatieDeep learning↔ vergelijken
- Semantische segmentatieDeep learning↔ vergelijken
- Transformator voor Visuele WaarnemingDeep learning↔ vergelijken
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →