Machine learningDeep learning / NLP / CV

Multimodal Doc2Vec

يمدّد إطار عمل Doc2Vec للمتجهات الفقرات (paragraph-vector framework) ليشمل معلومات من أكثر من نمط واحد — عادةً النص إلى جانب الصور أو الصوت أو البيانات الوصفية المهيكلة — منتجًا تضمينًا مشتركًا على مستوى المستند يلتقط الدلالات من مصادر متعددة في وقت واحد. يُستخدم في الاسترجاع عبر الأنماط (cross-modal retrieval)، والتصنيف متعدد المصادر (multi-source classification)، وتمثيل المستندات حيث لا يكفي النص وحده.

افتح في MethodMindقريبًافيديوقريبًاDownload slides

اقرأ الطريقة كاملة

للأعضاء فقط

سجّل الدخول بحساب مجاني لقراءة هذا القسم.

تسجيل الدخول

Method map

The neighbourhood of related methods — select a node to explore.

المصادر

  1. Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link

كيف تستشهد بهذه الصفحة

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/ar/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

يُستشهد بها في

ScholarGateMultimodal Doc2Vec (Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)). استُرجع بتاريخ 2026-06-15 من https://scholargate.app/ar/deep-learning/multimodal-doc2vec · مجموعة البيانات: https://doi.org/10.5281/zenodo.20539026