ScholarGate
Assistente
Machine learningDeep learning / NLP / CV

Word2Vec Multimodale

Word2Vec Multimodale estende il classico framework Word2Vec basando le rappresentazioni delle parole su segnali percettivi — tipicamente caratteristiche di immagini — oltre alle statistiche testuali distribuzionali. Il risultato sono vettori di parole che catturano sia i pattern di co-occorrenza linguistica sia il significato visivo, consentendo giudizi di somiglianza semantica più ricchi e migliori prestazioni in compiti a livello concettuale dove gli embedding puramente testuali risultano insufficienti.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Fonti

  1. Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135
  2. Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link

Come citare questa pagina

ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/it/deep-learning/multimodal-word2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateMultimodal Word2Vec (Multimodal Word2Vec (Cross-Modal Distributional Semantics)). Consultato il 2026-06-15 da https://scholargate.app/it/deep-learning/multimodal-word2vec · Insieme di dati: https://doi.org/10.5281/zenodo.20539026