Word2Vec Multimodal
Word2Vec Multimodal estén el marc clàssic de Word2Vec fonamentant les representacions de paraules en senyals perceptius — típicament característiques d'imatges — al costat d'estadístiques textuals de distribució. El resultat són vectors de paraules que capturen tant patrons de coocurrència lingüística com significat visual, permetent judicis de similitud semàntica més rics i un millor rendiment en tasques a nivell conceptual on els embeddings purament basats en text es queden curts.
Llegeix el mètode complet
Inicia la sessió amb un compte gratuït per llegir aquesta secció.
Method map
The neighbourhood of related methods — select a node to explore.
Fonts
- Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135 ↗
- Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link ↗
Com citar aquesta pàgina
ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/ca/deep-learning/multimodal-word2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Classificació multimodal basada en BERTAprenentatge profund↔ compare
- Multimodal Doc2VecAprenentatge profund↔ compare
- Multimodal Sentence EmbeddingsAprenentatge profund↔ compare
- Multimodal TransformerAprenentatge profund↔ compare
- Sentence EmbeddingsAprenentatge profund↔ compare
Citat per
Has vist cap problema en aquesta pàgina? Informa'n o suggereix una correcció →