Multimodal Word2Vec
Multimodal Word2Vec utvider det klassiske Word2Vec-rammeverket ved å forankre ordrepresentasjoner i perseptuelle signaler – typisk bildeegenskaper – i tillegg til distribusjonelle tekststatistikker. Resultatet er ordvektorer som fanger opp både lingvistiske samforekomstmønstre og visuell mening, noe som muliggjør rikere semantiske likhetsvurderinger og bedre ytelse på oppgaver på konseptnivå der rent tekstbaserte innbygginger kommer til kort.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Bruni, E., Tran, N.-K., & Baroni, M. (2014). Multimodal Distributional Semantics. Journal of Artificial Intelligence Research, 49, 1–47. DOI: 10.1613/jair.4135 ↗
- Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Distributed Representations of Words and Phrases and their Compositionality. Advances in Neural Information Processing Systems (NIPS), 26. link ↗
Slik siterer du denne siden
ScholarGate. (2026, June 3). Multimodal Word2Vec (Cross-Modal Distributional Semantics). ScholarGate. https://scholargate.app/no/deep-learning/multimodal-word2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Multimodal BERT-basert klassifiseringDyp læring↔ compare
- Multimodal Doc2VecDyp læring↔ compare
- Multimodale setningsinnleiringerDyp læring↔ compare
- Multimodal transformereDyp læring↔ compare
- SetningsembddingerDyp læring↔ compare
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →