Pielāgotais Vision Transformer
Pielāgotais Vision Transformer (Fine-Tuned Vision Transformer) pielāgo lielo, iepriekš apmācīto ViT modeli — kas sadala attēlus fiksēta izmēra daļās un apstrādā tās caur pašuzmanības slāņiem — jaunam attēlu klasifikācijas vai atpazīšanas uzdevumam, izmantojot salīdzinoši nelielu marķētu datu kopu. Tas sasniedz visaugstāko precizitāti datorredzē, izmantojot bagātīgas reprezentācijas, kas apgūtas liela mēroga iepriekšējās apmācības laikā.
Lasīt pilno metodes aprakstu
Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.
Metožu karte
Saistīto metožu apkaime — atlasiet mezglu, lai izpētītu.
+vēl 4
Avoti
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
Kā citēt šo lapu
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/lv/deep-learning/fine-tuned-vision-transformer
Kura metode?
Novietojiet šo metodi blakus tās tuvākajām radniecīgajām metodēm un lasiet tās līdzās — bibliotēka noliek grāmatas uz galda; izvēle ir jūsu.
- BERT klasifikācijaDziļā mācīšanās↔ salīdzināt
- Fine-Tuned konvolucionālais neironu tīklsDziļā mācīšanās↔ salīdzināt
- Attēlu klasifikācijaDziļā mācīšanās↔ salīdzināt
- Semantiskā segmentācijaDziļā mācīšanās↔ salīdzināt
- Vision TransformerDziļā mācīšanās↔ salīdzināt
Uz to atsaucas
Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →