ScholarGate
Assistant
Machine learningDeep learning / NLP / CV

Word2Vec Multimodal

Word2Vec Multimodal étend le cadre classique de Word2Vec en ancrant les représentations de mots dans des signaux perceptuels — typiquement des caractéristiques d'images — aux côtés de statistiques textuelles distributionnelles. Le résultat est des vecteurs de mots qui capturent à la fois les schémas de cooccurrence linguistique et le sens visuel, permettant des jugements de similarité sémantique plus riches et de meilleures performances sur des tâches au niveau conceptuel où les plongements purement textuels sont insuffisants.

Ouvrir dans MethodMindBientôtVidéoBientôtDownload slides

Lire la méthode complète

Réservé aux membres

Connectez-vous avec un compte gratuit pour lire cette section.

Se connecter

Method map

The neighbourhood of related methods — select a node to explore.

Sources

  1. Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135
  2. Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link

Comment citer cette page

ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/fr/deep-learning/multimodal-word2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Référencée par

ScholarGateMultimodal Word2Vec (Multimodal Word2Vec (Cross-Modal Distributional Semantics)). Consulté le 2026-06-15 sur https://scholargate.app/fr/deep-learning/multimodal-word2vec · Jeu de données : https://doi.org/10.5281/zenodo.20539026