Vision Transformer Iliyobadilishwa
Vision Transformer Iliyobadilishwa (Fine-Tuned ViT) hubadilisha modeli kubwa ya awali iliyofunzwa ya ViT — ambayo hugawanya picha katika vipande vya ukubwa sawa na huchakata kupitia tabaka za kujijali — kwa kazi mpya ya uainishaji au utambuzi wa picha kwa kutumia seti ndogo ya data yenye lebo. Inafikia usahihi wa hali ya juu katika taswira kompyuta kwa kutumia uwakilishi tajiri uliojifunzwa wakati wa mafunzo ya awali kwa kiwango kikubwa.
Soma mbinu kamili
Ingia kwa akaunti ya bure ili kusoma sehemu hii.
Ramani ya mbinu
Jirani ya mbinu zinazohusiana — chagua nodi ili kuchunguza.
+4 zaidi
Vyanzo
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
Jinsi ya kunukuu ukurasa huu
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/sw/deep-learning/fine-tuned-vision-transformer
Mbinu ipi?
Weka mbinu hii kando ya jamaa zake wa karibu na uzisome bega kwa bega — maktaba huweka vitabu mezani; uamuzi ni wako.
- Uainishaji unaotumia BERTUjifunzaji wa Kina↔ linganisha
- Convolutional Neural Network Iliyoendeshwa kwa KinaUjifunzaji wa Kina↔ linganisha
- Uainishaji wa PichaUjifunzaji wa Kina↔ linganisha
- Mgawanyo wa KisemantikiUjifunzaji wa Kina↔ linganisha
- Transformer wa MaonoUjifunzaji wa Kina↔ linganisha
Imerejelewa na
Umeona tatizo kwenye ukurasa huu? Ripoti au pendekeza marekebisho →