Word2Vec Multimodal
Word2Vec Multimodal étend le cadre classique de Word2Vec en ancrant les représentations de mots dans des signaux perceptuels — typiquement des caractéristiques d'images — aux côtés de statistiques textuelles distributionnelles. Le résultat est des vecteurs de mots qui capturent à la fois les schémas de cooccurrence linguistique et le sens visuel, permettant des jugements de similarité sémantique plus riches et de meilleures performances sur des tâches au niveau conceptuel où les plongements purement textuels sont insuffisants.
Lire la méthode complète
Connectez-vous avec un compte gratuit pour lire cette section.
Method map
The neighbourhood of related methods — select a node to explore.
Sources
- Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135 ↗
- Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link ↗
Comment citer cette page
ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/fr/deep-learning/multimodal-word2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Classification multimodale basée sur BERTApprentissage profond↔ compare
- Multimodal Doc2VecApprentissage profond↔ compare
- Plongements de phrases multimodauxApprentissage profond↔ compare
- Transformeur MultimodalApprentissage profond↔ compare
- Plongements de phrasesApprentissage profond↔ compare
Référencée par
Une erreur sur cette page ? Signalez-la ou proposez une correction →