Machine learningDeep learning / NLP / CV

कमजोर पर्यवेक्षित विजन ट्रांसफार्मर

कमजोर पर्यवेक्षित विजन ट्रांसफार्मर (WS-ViT) विजन ट्रांसफार्मर को ऐसे इमेज डेटा पर प्रशिक्षित करता है जिसमें सटीक पिक्सेल-स्तरीय एनोटेशन की कमी होती है, इसके बजाय छवि-स्तरीय क्लास टैग, बाउंडिंग बॉक्स या वेब-स्क्रैप्ड टेक्स्ट जैसे सस्ते, अधिक शोर वाले पर्यवेक्षण का उपयोग करता है। ट्रांसफार्मर का वैश्विक स्व-ध्यान तंत्र इसे वस्तुओं को स्थानीयकृत करने और इन अधूरी लेबल से विशिष्ट विशेषताओं को सीखने में विशेष रूप से सक्षम बनाता है।

MethodMind में खोलेंजल्द हीवीडियोजल्द हीDownload slides

पूरी विधि पढ़ें

केवल सदस्यों के लिए

यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।

साइन इन करें

Method map

The neighbourhood of related methods — select a node to explore.

स्रोत

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link
  2. Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106

इस पृष्ठ का उद्धरण कैसे दें

ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/hi/deep-learning/weakly-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateWeakly supervised vision transformer (Weakly Supervised Vision Transformer (WS-ViT)). 2026-06-15 को यहाँ से प्राप्त https://scholargate.app/hi/deep-learning/weakly-supervised-vision-transformer · डेटासेट: https://doi.org/10.5281/zenodo.20539026