Machine learningDeep learning / NLP / CV

Multimodal Doc2Vec

Multimodal Doc2Vec extinde cadrul vector-paragraf Doc2Vec pentru a încorpora informații din mai mult de o modalitate — de obicei text alături de imagini, audio sau metadate structurate — producând o reprezentare comună la nivel de document (embedding) care surprinde simultan semantica din multiple surse. Este utilizat pentru regăsirea cross-modală, clasificarea multi-sursă și reprezentarea documentelor unde textul singur este insuficient.

Deschide în MethodMindÎn curândVideoÎn curândDownload slides

Citește metoda completă

Doar pentru membri

Autentifică-te cu un cont gratuit pentru a citi această secțiune.

Autentificare

Method map

The neighbourhood of related methods — select a node to explore.

Surse

  1. Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link

Cum se citează această pagină

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/ro/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citat de

ScholarGateMultimodal Doc2Vec (Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)). Preluat la 2026-06-15 de pe https://scholargate.app/ro/deep-learning/multimodal-doc2vec · Set de date: https://doi.org/10.5281/zenodo.20539026