फाइन-ट्यून्ड विजन ट्रांसफार्मर
फाइन-ट्यून्ड विजन ट्रांसफार्मर (Fine-Tuned Vision Transformer) एक बड़े प्री-ट्रेन्ड ViT मॉडल को अनुकूलित करता है — जो छवियों को निश्चित-आकार के पैच में विभाजित करता है और उन्हें सेल्फ-अटेंशन लेयर्स के माध्यम से प्रोसेस करता है — अपेक्षाकृत छोटे लेबल वाले डेटासेट का उपयोग करके एक नए छवि वर्गीकरण या पहचान कार्य के लिए। यह बड़े पैमाने पर प्री-ट्रेनिंग के दौरान सीखे गए समृद्ध अभ्यावेदन (representations) का लाभ उठाकर कंप्यूटर विज़न में अत्याधुनिक सटीकता प्राप्त करता है।
पूरी विधि पढ़ें
यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।
पद्धति मानचित्र
सम्बन्धित पद्धतियों का परिवेश — अन्वेषण हेतु किसी नोड का चयन करें।
+4 और
स्रोत
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
इस पृष्ठ का उद्धरण कैसे दें
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/hi/deep-learning/fine-tuned-vision-transformer
कौन-सी पद्धति?
इस पद्धति को उसकी निकटतम सजातीय पद्धतियों के साथ रखकर उन्हें साथ-साथ पढ़ें — पुस्तकालय पुस्तकें मेज़ पर रख देता है; चुनाव आपका है।
- BERT-आधारित वर्गीकरणगहन अधिगम↔ तुलना करें
- फाइन-ट्यून्ड कन्волюशनल न्यूरल नेटवर्कगहन अधिगम↔ तुलना करें
- छवि वर्गीकरणगहन अधिगम↔ तुलना करें
- सेमेंटिक सेगमेंटेशन (Semantic Segmentation)गहन अधिगम↔ तुलना करें
- विजन ट्रांसफार्मरगहन अधिगम↔ तुलना करें