Multimodální Doc2Vec
Multimodální Doc2Vec rozšiřuje rámec Doc2Vec pro vektorizaci odstavců o informace z více modalit – typicky textu spolu s obrázky, zvukem nebo strukturovanými metadaty – čímž vytváří sdílené vnoření na úrovni dokumentu, které současně zachycuje sémantiku z více zdrojů. Používá se pro křížově modální vyhledávání, klasifikaci z více zdrojů a reprezentaci dokumentů, kde samotný text nestačí.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link ↗
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/cs/deep-learning/multimodal-doc2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Doc2VecDolování textu↔ compare
- Víceúčelová klasifikace založená na BERTHluboké učení↔ compare
- Vícemodální vnoření vět (Multimodal Sentence Embeddings)Hluboké učení↔ compare
- Multimodální TransformerHluboké učení↔ compare
- Multimodal Word2VecHluboké učení↔ compare
- Vektorové reprezentace větHluboké učení↔ compare
Odkazuje sem
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →