Word2Vec Multimodale
Word2Vec Multimodale estende il classico framework Word2Vec basando le rappresentazioni delle parole su segnali percettivi — tipicamente caratteristiche di immagini — oltre alle statistiche testuali distribuzionali. Il risultato sono vettori di parole che catturano sia i pattern di co-occorrenza linguistica sia il significato visivo, consentendo giudizi di somiglianza semantica più ricchi e migliori prestazioni in compiti a livello concettuale dove gli embedding puramente testuali risultano insufficienti.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
Fonti
- Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135 ↗
- Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link ↗
Come citare questa pagina
ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/it/deep-learning/multimodal-word2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Classificazione basata su BERT multimodaleApprendimento profondo↔ compare
- Doc2Vec MultimodaleApprendimento profondo↔ compare
- Embedding multimodali di frasiApprendimento profondo↔ compare
- Transformer MultimodaleApprendimento profondo↔ compare
- Sentence EmbeddingsApprendimento profondo↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →