ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodal Word2Vec

Multimodal Word2Vec utvider det klassiske Word2Vec-rammeverket ved å forankre ordrepresentasjoner i perseptuelle signaler – typisk bildeegenskaper – i tillegg til distribusjonelle tekststatistikker. Resultatet er ordvektorer som fanger opp både lingvistiske samforekomstmønstre og visuell mening, noe som muliggjør rikere semantiske likhetsvurderinger og bedre ytelse på oppgaver på konseptnivå der rent tekstbaserte innbygginger kommer til kort.

Åpne i MethodMindSnartVideoSnartDownload slides

Les hele metoden

Kun for medlemmer

Logg inn med en gratis konto for å lese denne delen.

Logg inn

Method map

The neighbourhood of related methods — select a node to explore.

Kilder

  1. Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135
  2. Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link

Slik siterer du denne siden

ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/no/deep-learning/multimodal-word2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referert av

ScholarGateMultimodal Word2Vec (Multimodal Word2Vec (Cross-Modal Distributional Semantics)). Hentet 2026-06-15 fra https://scholargate.app/no/deep-learning/multimodal-word2vec · Datasett: https://doi.org/10.5281/zenodo.20539026