Häälestatud nägemistransformaator
Häälestatud nägemistransformaator (Fine-Tuned Vision Transformer) kohandab suurt eelnevalt koolitatud ViT-mudelit – mis jagab pildid fikseeritud suurusega tükkideks ja töötleb neid enesetähelepanu kihtide kaudu – uueks pildiklassifitseerimis- või äratundmisülesandeks, kasutades suhteliselt väikest märgistatud andmestikku. See saavutab arvutinägemises tipptasemel täpsuse, kasutades ära suures mahus eelkoolituse käigus õpitud rikkalikke representatsioone.
Loe meetodi täielikku kirjeldust
Selle osa lugemiseks logi sisse tasuta kontoga.
Meetodikaart
Seotud meetodite ümbruskond — vali sõlm, et seda uurida.
+4 veel
Allikad
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
Kuidas sellele lehele viidata
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/et/deep-learning/fine-tuned-vision-transformer
Milline meetod?
Aseta see meetod oma lähimate sugulaste kõrvale ja loe neid kõrvuti — raamatukogu laob raamatud lauale; valik on sinu.
- BERT-põhine klassifitseerimineSüvaõpe↔ võrdle
- Peenreguleeritud konvolutsiooniline närvivõrkSüvaõpe↔ võrdle
- PildiklassifikatsioonSüvaõpe↔ võrdle
- Semantiline segmentatsioonSüvaõpe↔ võrdle
- Vision TransformerSüvaõpe↔ võrdle
Sellele viitavad
Märkasid sellel lehel viga? Teata sellest või paku parandust →