Multimodal Word2Vec
Multimodal Word2Vec utökar det klassiska Word2Vec-ramverket genom att grunda ordrepresentationer i perceptuella signaler – typiskt bilddrag – vid sidan av distributionella textstatistik. Resultatet är ordvektorer som fångar både lingvistiska samförekomstmönster och visuell mening, vilket möjliggör rikare bedömningar av semantisk likhet och bättre prestanda på konceptnivåuppgifter där rent textbaserade inbäddningar brister.
Läs hela metoden
Logga in med ett kostnadsfritt konto för att läsa avsnittet.
Method map
The neighbourhood of related methods — select a node to explore.
Källor
- Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135 ↗
- Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link ↗
Så citerar du den här sidan
ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/sv/deep-learning/multimodal-word2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Multimodal BERT-baserad klassificeringDjupinlärning↔ compare
- Multimodal Doc2VecDjupinlärning↔ compare
- Multimodala meningsinbäddningarDjupinlärning↔ compare
- Multimodal TransformerDjupinlärning↔ compare
- MeningsinbäddningarDjupinlärning↔ compare
Refereras av
Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →