ScholarGate
सहायक
Machine learningDeep learning / NLP / CV

फाइन-ट्यून्ड विजन ट्रांसफार्मर

फाइन-ट्यून्ड विजन ट्रांसफार्मर (Fine-Tuned Vision Transformer) एक बड़े प्री-ट्रेन्ड ViT मॉडल को अनुकूलित करता है — जो छवियों को निश्चित-आकार के पैच में विभाजित करता है और उन्हें सेल्फ-अटेंशन लेयर्स के माध्यम से प्रोसेस करता है — अपेक्षाकृत छोटे लेबल वाले डेटासेट का उपयोग करके एक नए छवि वर्गीकरण या पहचान कार्य के लिए। यह बड़े पैमाने पर प्री-ट्रेनिंग के दौरान सीखे गए समृद्ध अभ्यावेदन (representations) का लाभ उठाकर कंप्यूटर विज़न में अत्याधुनिक सटीकता प्राप्त करता है।

MethodMind में खोलेंजल्द हीवीडियोजल्द हीस्लाइड डाउनलोड करें

पूरी विधि पढ़ें

केवल सदस्यों के लिए

यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।

साइन इन करें

पद्धति मानचित्र

सम्बन्धित पद्धतियों का परिवेश — अन्वेषण हेतु किसी नोड का चयन करें।

+4 और

स्रोत

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

इस पृष्ठ का उद्धरण कैसे दें

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/hi/deep-learning/fine-tuned-vision-transformer

कौन-सी पद्धति?

इस पद्धति को उसकी निकटतम सजातीय पद्धतियों के साथ रखकर उन्हें साथ-साथ पढ़ें — पुस्तकालय पुस्तकें मेज़ पर रख देता है; चुनाव आपका है।

साथ-साथ तुलना करें

इनमें संदर्भित

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). 2026-06-15 को यहाँ से प्राप्त https://scholargate.app/hi/deep-learning/fine-tuned-vision-transformer · डेटासेट: https://doi.org/10.5281/zenodo.20539026