Мультимодальный Doc2Vec
Мультимодальный Doc2Vec расширяет структуру векторного представления документов Doc2Vec для включения информации из более чем одной модальности — обычно текста наряду с изображениями, аудио или структурированными метаданными — создавая общее векторное представление уровня документа, которое одновременно улавливает семантику из нескольких источников. Он используется для кросс-модального поиска, многоисточниковой классификации и представления документов, где одного текста недостаточно.
Читать метод полностью
Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.
Method map
The neighbourhood of related methods — select a node to explore.
Источники
- Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link ↗
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
Как цитировать эту страницу
ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/ru/deep-learning/multimodal-doc2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Doc2VecИнтеллектуальный анализ текста↔ compare
- Мультимодальная классификация на основе BERTГлубокое обучение↔ compare
- Мультимодальные вложения предложенийГлубокое обучение↔ compare
- Мультимодальный трансформерГлубокое обучение↔ compare
- Мультимодальный Word2VecГлубокое обучение↔ compare
- Векторные представления предложенийГлубокое обучение↔ compare
Упоминается в
Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →