Machine learning

विजन ट्रांसफार्मर

विजन ट्रांसफार्मर (ViT), जिसे 2021 में Dosovitskiy और सहयोगियों द्वारा प्रस्तुत किया गया था, एक छवि को निश्चित-आकार के पैच में विभाजित करता है, उन पैच को एक अनुक्रम के रूप में मानता है, और छवि वर्गीकरण के लिए ट्रांसफार्मर सेल्फ-अटेंशन मैकेनिज्म लागू करता है। पर्याप्त प्रशिक्षण डेटा होने पर, यह कनवल्शनल न्यूरल नेटवर्क (CNN) से बेहतर प्रदर्शन करता है।

MethodMind में खोलेंजल्द हीवीडियोजल्द हीDownload slides

पूरी विधि पढ़ें

केवल सदस्यों के लिए

यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।

साइन इन करें

Method map

The neighbourhood of related methods — select a node to explore.

विजन ट्रांसफार्मर

डिफ्यूजन मॉडल जनरेटिव एडवरसैरियल नेटवर…रैंडम फ़ॉरेस्ट सपोर्ट वेक्टर मशीन (वर्ग…वैरिएशन ऑटोएन्कोडर BERT फाइन-ट्यूनिंग CLIP डोमेन-अनुकूली ट्रांसफार्…डोमेन-अनुकूली विजन ट्रां…स्पष्टीकरणीय विजन ट्रांस…

+27 more

स्रोत

Dosovitskiy, A. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. ICLR. link ↗
Touvron, H. et al. (2021). Training Data-Efficient Image Transformers. ICML. link ↗

इस पृष्ठ का उद्धरण कैसे दें

ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/hi/deep-learning/vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

डिफ्यूजन मॉडलगहन अधिगम↔ compare
जनरेटिव एडवरसैरियल नेटवर्कगहन अधिगम↔ compare
रैंडम फ़ॉरेस्टमशीन अधिगम↔ compare
सपोर्ट वेक्टर मशीन (वर्गीकरण)मशीन अधिगम↔ compare
वैरिएशन ऑटोएन्कोडरगहन अधिगम↔ compare

Compare side by side →

इनमें संदर्भित

इस पृष्ठ पर कोई त्रुटि दिखी? सूचित करें या सुधार सुझाएँ →

पूरी विधि पढ़ें

Method map

स्रोत

इस पृष्ठ का उद्धरण कैसे दें

संबंधित विधियाँ

Which method?

इनमें संदर्भित