Machine learningDeep learning / NLP / CV

Multimodálny Doc2Vec

Multimodálny Doc2Vec rozširuje rámec vektorov odsekov Doc2Vec o začlenenie informácií z viacerých modalít — typicky textu spolu s obrázkami, zvukom alebo štruktúrovanými metadátami — čím produkuje zdieľané vloženie na úrovni dokumentu, ktoré súčasne zachytáva sémantiku z viacerých zdrojov. Používa sa na krížovú modalitnú extrakciu, klasifikáciu z viacerých zdrojov a reprezentáciu dokumentov, kde samotný text nie je dostatočný.

Otvoriť v MethodMindČoskoroVideoČoskoroDownload slides

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link

Ako citovať túto stránku

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/sk/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazujú sem

ScholarGateMultimodal Doc2Vec (Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)). Získané 2026-06-15 z https://scholargate.app/sk/deep-learning/multimodal-doc2vec · Dátová sada: https://doi.org/10.5281/zenodo.20539026