ScholarGate
Asisten
Machine learningDeep learning / NLP / CV

Multimodal Doc2Vec

Multimodal Doc2Vec memperluas kerangka kerja vektor-paragraf Doc2Vec untuk memasukkan informasi dari lebih dari satu modalitas — biasanya teks bersama dengan gambar, audio, atau metadata terstruktur — menghasilkan embedding tingkat dokumen bersama yang menangkap semantik dari berbagai sumber secara bersamaan. Ini digunakan untuk pengambilan lintas-modal, klasifikasi multi-sumber, dan representasi dokumen di mana teks saja tidak mencukupi.

Buka di MethodMindSegeraVideoSegeraDownload slides

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Method map

The neighbourhood of related methods — select a node to explore.

Sumber

  1. Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link

Cara menyitasi halaman ini

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/id/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Dirujuk oleh

ScholarGateMultimodal Doc2Vec (Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)). Diakses 2026-06-15 dari https://scholargate.app/id/deep-learning/multimodal-doc2vec · Set data: https://doi.org/10.5281/zenodo.20539026