Machine learningDeep learning / NLP / CV

Häälestatud nägemistransformaator

Häälestatud nägemistransformaator (Fine-Tuned Vision Transformer) kohandab suurt eelnevalt koolitatud ViT-mudelit – mis jagab pildid fikseeritud suurusega tükkideks ja töötleb neid enesetähelepanu kihtide kaudu – uueks pildiklassifitseerimis- või äratundmisülesandeks, kasutades suhteliselt väikest märgistatud andmestikku. See saavutab arvutinägemises tipptasemel täpsuse, kasutades ära suures mahus eelkoolituse käigus õpitud rikkalikke representatsioone.

Ava rakenduses MethodMindPeagiVideoPeagiLaadi slaidid alla

Loe meetodi täielikku kirjeldust

Ainult liikmetele

Selle osa lugemiseks logi sisse tasuta kontoga.

Logi sisse

Meetodikaart

Seotud meetodite ümbruskond — vali sõlm, et seda uurida.

Häälestatud nägemistransformaator

BERT-põhine klassifitsee…Peenreguleeritud konvolu…Pildiklassifikatsioon Semantiline segmentatsio…Vision Transformer Domeeni-adaptiivne Visio…Peenhäälestatud difusioo…Peenreguleeritud generat…Pildiklassifikatsiooni p…Täpsustatud semantiline…

+4 veel

Allikad

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗

Kuidas sellele lehele viidata

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/et/deep-learning/fine-tuned-vision-transformer

Milline meetod?

Aseta see meetod oma lähimate sugulaste kõrvale ja loe neid kõrvuti — raamatukogu laob raamatud lauale; valik on sinu.

BERT-põhine klassifitseerimineSüvaõpe↔ võrdle
Peenreguleeritud konvolutsiooniline närvivõrkSüvaõpe↔ võrdle
PildiklassifikatsioonSüvaõpe↔ võrdle
Semantiline segmentatsioonSüvaõpe↔ võrdle
Vision TransformerSüvaõpe↔ võrdle

Võrdle kõrvuti →

Sellele viitavad

Domeeni-adaptiivne Vision Transformer Peenreguleeritud konvolutsiooniline närvivõrk Peenhäälestatud difusioonimudelit Peenreguleeritud generatiivsed vastasseadmed Pildiklassifikatsiooni peenhäälestus Täpsustatud semantiline segmentatsioon Multimodaalne Visioonitransformaator Eneseliseeritud nägemistransformaator Poolitud järelevalvega nägemustransformaator Ülekandeõpe pildiklassifitseerimisel

Märkasid sellel lehel viga? Teata sellest või paku parandust →

Loe meetodi täielikku kirjeldust

Meetodikaart

Allikad

Kuidas sellele lehele viidata

Seotud meetodid

Milline meetod?

Sellele viitavad