Fine-Tuned Vision Transformer
Fine-Tuned Vision Transformer prilagođava veliki prethodno obučeni ViT model — koji deli slike na zakrpe fiksne veličine i obrađuje ih kroz slojeve samopažnje — novom zadatku klasifikacije ili prepoznavanja slika koristeći relativno mali skup označenih podataka. Postiže najsavremeniju tačnost u kompjuterskom vidu tako što koristi bogate reprezentacije naučene tokom obimnog prethodnog treniranja.
Pročitajte celu metodu
Prijavite se besplatnim nalogom da biste pročitali ovaj odeljak.
Method map
The neighbourhood of related methods — select a node to explore.
+4 more
Izvori
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/sr/deep-learning/fine-tuned-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-based ClassificationDuboko učenje↔ compare
- Fino podešena konvoluciona neuronska mrežaDuboko učenje↔ compare
- Класификација сликаDuboko učenje↔ compare
- Semantička segmentacijaDuboko učenje↔ compare
- Vision TransformerDuboko učenje↔ compare
Citirana u
Uočili ste grešku na ovoj stranici? Prijavite je ili predložite ispravku →