Machine learningDeep learning / NLP / CV

Мультимодальний Doc2Vec

Мультимодальний Doc2Vec розширює фреймворк векторів параграфів Doc2Vec для включення інформації з кількох модальностей — зазвичай тексту поряд із зображеннями, аудіо або структурованими метаданими — створюючи спільне вбудовування на рівні документа, яке одночасно захоплює семантику з кількох джерел. Він використовується для міжмодального пошуку, багатоджерельної класифікації та представлення документів, коли сам лише текст є недостатнім.

Відкрити у MethodMindНезабаромВідеоНезабаромDownload slides

Читати метод повністю

Лише для учасників

Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.

Увійти

Method map

The neighbourhood of related methods — select a node to explore.

Джерела

  1. Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link

Як цитувати цю сторінку

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/uk/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Згадується в

ScholarGateMultimodal Doc2Vec (Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)). Отримано 2026-06-15 з https://scholargate.app/uk/deep-learning/multimodal-doc2vec · Набір даних: https://doi.org/10.5281/zenodo.20539026