Multimodal Doc2Vec
Multimodal Doc2Vec rozszerza ramy wektorów dokumentów (paragraph-vector) z Doc2Vec o informacje z więcej niż jednej modalności — zazwyczaj tekstu obok obrazów, dźwięku lub ustrukturyzowanych metadanych — generując wspólne osadzenie (embedding) na poziomie dokumentu, które jednocześnie uwzględnia semantykę z wielu źródeł. Jest stosowany do wyszukiwania między modalnościami (cross-modal retrieval), klasyfikacji wieloźródłowej oraz reprezentacji dokumentów, gdy sam tekst jest niewystarczający.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link ↗
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/pl/deep-learning/multimodal-doc2vec
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Doc2VecEksploracja tekstu↔ compare
- Klasyfikacja multimodalna oparta na BERTUczenie głębokie↔ compare
- Osadzenia zdań multimodalnychUczenie głębokie↔ compare
- Transformator multimodalnyUczenie głębokie↔ compare
- Multimodal Word2VecUczenie głębokie↔ compare
- Osadzanie zdańUczenie głębokie↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →