ScholarGate
Avustaja
Machine learningDeep learning / NLP / CV

Hienosäädetty Vision Transformer

Hienosäädetty Vision Transformer (Fine-Tuned Vision Transformer) mukauttaa suuren, esikoulutetun ViT-mallin – joka jakaa kuvat kiinteän kokoisiksi paloiksi ja käsittelee niitä itsehuomiokerrosten avulla – uuteen kuvien luokittelu- tai tunnistustehtävään suhteellisen pienellä merkityllä aineistolla. Se saavuttaa huippuluokan tarkkuuden tietokonenäössä hyödyntämällä suuren mittakaavan esikoulutuksen aikana opittuja rikkaita esitysmuotoja.

Avaa sovelluksessa MethodMindTulossaVideoTulossaLataa diat

Lue koko menetelmä

Vain jäsenille

Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.

Kirjaudu sisään

Menetelmäkartta

Lähimenetelmien naapurusto — valitse solmu tutkiaksesi.

+4 lisää

Lähteet

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

Näin viittaat tähän sivuun

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/fi/deep-learning/fine-tuned-vision-transformer

Mikä menetelmä?

Aseta tämä menetelmä lähimpien sukulaistensa rinnalle ja lue niitä yhdessä — kirjasto asettaa teokset pöydälle; valinta on sinun.

Vertaa rinnakkain

Tähän viittaavat

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). Haettu 2026-06-15 osoitteesta https://scholargate.app/fi/deep-learning/fine-tuned-vision-transformer · Aineisto: https://doi.org/10.5281/zenodo.20539026