Hienosäädetty Vision Transformer
Hienosäädetty Vision Transformer (Fine-Tuned Vision Transformer) mukauttaa suuren, esikoulutetun ViT-mallin – joka jakaa kuvat kiinteän kokoisiksi paloiksi ja käsittelee niitä itsehuomiokerrosten avulla – uuteen kuvien luokittelu- tai tunnistustehtävään suhteellisen pienellä merkityllä aineistolla. Se saavuttaa huippuluokan tarkkuuden tietokonenäössä hyödyntämällä suuren mittakaavan esikoulutuksen aikana opittuja rikkaita esitysmuotoja.
Lue koko menetelmä
Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.
Menetelmäkartta
Lähimenetelmien naapurusto — valitse solmu tutkiaksesi.
+4 lisää
Lähteet
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
Näin viittaat tähän sivuun
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/fi/deep-learning/fine-tuned-vision-transformer
Mikä menetelmä?
Aseta tämä menetelmä lähimpien sukulaistensa rinnalle ja lue niitä yhdessä — kirjasto asettaa teokset pöydälle; valinta on sinun.
- BERT-pohjainen luokitteluSyväoppiminen↔ vertaa
- Hienosäädetty konvoluutioneuroverkkoSyväoppiminen↔ vertaa
- KuvanluokitteluSyväoppiminen↔ vertaa
- Semanttinen segmentointiSyväoppiminen↔ vertaa
- Vision TransformerSyväoppiminen↔ vertaa
Tähän viittaavat
Huomasitko virheen tällä sivulla? Ilmoita siitä tai ehdota korjausta →