Мультимодальний Doc2Vec
Мультимодальний Doc2Vec розширює фреймворк векторів параграфів Doc2Vec для включення інформації з кількох модальностей — зазвичай тексту поряд із зображеннями, аудіо або структурованими метаданими — створюючи спільне вбудовування на рівні документа, яке одночасно захоплює семантику з кількох джерел. Він використовується для міжмодального пошуку, багатоджерельної класифікації та представлення документів, коли сам лише текст є недостатнім.
Читати метод повністю
Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.
Method map
The neighbourhood of related methods — select a node to explore.
Джерела
- Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link ↗
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
Як цитувати цю сторінку
ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/uk/deep-learning/multimodal-doc2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Doc2VecІнтелектуальний аналіз тексту↔ compare
- Мультимодальна класифікація на основі BERTГлибоке навчання↔ compare
- Мультимодальні вбудовування реченьГлибоке навчання↔ compare
- Мультимодальний ТрансформерГлибоке навчання↔ compare
- Мультимодальний Word2VecГлибоке навчання↔ compare
- Векторні представлення реченьГлибоке навчання↔ compare
Згадується в
Помітили помилку на цій сторінці? Повідомте про неї або запропонуйте виправлення →