CLIP — कंट्रास्टिव लैंग्वेज-इमेज प्रीट्रेनिंग
CLIP (कंट्रास्टिव लैंग्वेज-इमेज प्रीट्रेनिंग) 2021 में OpenAI में रैडफोर्ड एट अल. द्वारा प्रस्तुत एक विजन-लैंग्वेज मॉडल है जो कंट्रास्टिव ऑब्जेक्टिव का उपयोग करके 400 मिलियन इंटरनेट-स्रोत इमेज-टेक्स्ट युग्मों पर प्रशिक्षण द्वारा संरेखित इमेज और टेक्स्ट प्रतिनिधित्व को संयुक्त रूप से सीखता है, जिससे किसी भी कार्य-विशिष्ट फाइन-ट्यूनिंग के बिना इमेज वर्गीकरण कार्यों में जीरो-शॉट ट्रांसफर सक्षम होता है।
पूरी विधि पढ़ें
यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।
Method map
The neighbourhood of related methods — select a node to explore.
स्रोत
- Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., Sastry, G., Askell, A., Mishkin, P., Clark, J., Krueger, G., & Sutskever, I. (2021). Learning Transferable Visual Models From Natural Language Supervision. Proceedings of the 38th International Conference on Machine Learning, PMLR 139, 8748–8763. link ↗
- Radford, A., et al. (2021). Learning Transferable Visual Models From Natural Language Supervision. arXiv:2103.00020. link ↗
- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. ISBN: 978-0-262-03561-3
इस पृष्ठ का उद्धरण कैसे दें
ScholarGate. (2026, June 3). Contrastive Language-Image Pretraining. ScholarGate. https://scholargate.app/hi/deep-learning/clip
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- रेसिडुअल नेटवर्क (ResNet)गहन अधिगम↔ compare
- विजन ट्रांसफार्मरगहन अधिगम↔ compare