Machine learningDeep learning / NLP / CV

Multimodální Doc2Vec

Multimodální Doc2Vec rozšiřuje rámec Doc2Vec pro vektorizaci odstavců o informace z více modalit – typicky textu spolu s obrázky, zvukem nebo strukturovanými metadaty – čímž vytváří sdílené vnoření na úrovni dokumentu, které současně zachycuje sémantiku z více zdrojů. Používá se pro křížově modální vyhledávání, klasifikaci z více zdrojů a reprezentaci dokumentů, kde samotný text nestačí.

Otevřít v MethodMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link

Jak citovat tuto stránku

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/cs/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazuje sem

ScholarGateMultimodal Doc2Vec (Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)). Získáno 2026-06-15 z https://scholargate.app/cs/deep-learning/multimodal-doc2vec · Datová sada: https://doi.org/10.5281/zenodo.20539026