ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodal Word2Vec

Multimodal Word2Vec utökar det klassiska Word2Vec-ramverket genom att grunda ordrepresentationer i perceptuella signaler – typiskt bilddrag – vid sidan av distributionella textstatistik. Resultatet är ordvektorer som fångar både lingvistiska samförekomstmönster och visuell mening, vilket möjliggör rikare bedömningar av semantisk likhet och bättre prestanda på konceptnivåuppgifter där rent textbaserade inbäddningar brister.

Öppna i MethodMindSnartVideoSnartDownload slides

Läs hela metoden

Endast för medlemmar

Logga in med ett kostnadsfritt konto för att läsa avsnittet.

Logga in

Method map

The neighbourhood of related methods — select a node to explore.

Källor

  1. Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135
  2. Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link

Så citerar du den här sidan

ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/sv/deep-learning/multimodal-word2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Refereras av

ScholarGateMultimodal Word2Vec (Multimodal Word2Vec (Cross-Modal Distributional Semantics)). Hämtad 2026-06-15 från https://scholargate.app/sv/deep-learning/multimodal-word2vec · Datamängd: https://doi.org/10.5281/zenodo.20539026