ScholarGate
Assistent
Machine learning

CLIP — Contrastive Language-Image Pretraining

CLIP (Contrastive Language-Image Pretraining) is een visie-taalmodel dat in 2021 door Radford et al. bij OpenAI werd geïntroduceerd. Het leert gezamenlijk uitgelijnde beeld- en tekstrepresentaties door te trainen op 400 miljoen van het internet afkomstige beeld-tekstparen met behulp van een contrastieve doelstelling, waardoor zero-shot overdracht naar beeldclassificatietaken mogelijk is zonder taakspecifieke fine-tuning.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., Sastry, G., Askell, A., Mishkin, P., Clark, J., Krueger, G., & Sutskever, I. (2021). Learning Transferable Visual Models From Natural Language Supervision. Proceedings of the 38th International Conference on Machine Learning, PMLR 139, 8748–8763. link
  2. Radford, A., et al. (2021). Learning Transferable Visual Models From Natural Language Supervision. arXiv:2103.00020. link
  3. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. ISBN: 978-0-262-03561-3

Deze pagina citeren

ScholarGate. (2026, June 3). Contrastive Language-Image Pretraining. ScholarGate. https://scholargate.app/nl/deep-learning/clip

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Geciteerd door

ScholarGateCLIP (Contrastive Language-Image Pretraining). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/clip · Gegevensset: https://doi.org/10.5281/zenodo.20539026