Machine learningDeep learning / NLP / CV

Multimodal Doc2Vec

A Multimodal Doc2Vec a Doc2Vec eljárás párhuzamos vektor keretrendszerét terjeszti ki, hogy egynél több modalitásból – tipikusan szöveg mellett képekből, hangból vagy strukturált metadatából – származó információt integráljon, így egy közös dokumentumszintű beágyazást hoz létre, amely egyszerre ragadja meg a több forrásból származó szemantikai jelentést. Kereszt-modális lekérdezésre, több forrásból származó osztályozásra és olyan dokumentumreprezentációra használják, ahol a csak szöveges információ nem elegendő.

Megnyitás itt: MethodMindHamarosanVideóHamarosanDownload slides

A teljes módszer elolvasása

Csak tagoknak

Jelentkezzen be ingyenes fiókkal a szakasz elolvasásához.

Bejelentkezés

Method map

The neighbourhood of related methods — select a node to explore.

Források

  1. Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link

Hogyan hivatkozzon erre az oldalra

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/hu/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Hivatkozik rá

ScholarGateMultimodal Doc2Vec (Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)). Letöltve 2026-06-15, forrás: https://scholargate.app/hu/deep-learning/multimodal-doc2vec · Adatkészlet: https://doi.org/10.5281/zenodo.20539026