Machine learningDeep learning / NLP / CV

Multimodal Doc2Vec

يمدّد إطار عمل Doc2Vec للمتجهات الفقرات (paragraph-vector framework) ليشمل معلومات من أكثر من نمط واحد — عادةً النص إلى جانب الصور أو الصوت أو البيانات الوصفية المهيكلة — منتجًا تضمينًا مشتركًا على مستوى المستند يلتقط الدلالات من مصادر متعددة في وقت واحد. يُستخدم في الاسترجاع عبر الأنماط (cross-modal retrieval)، والتصنيف متعدد المصادر (multi-source classification)، وتمثيل المستندات حيث لا يكفي النص وحده.

افتح في MethodMindقريبًافيديوقريبًاDownload slides

اقرأ الطريقة كاملة

للأعضاء فقط

سجّل الدخول بحساب مجاني لقراءة هذا القسم.

تسجيل الدخول

Method map

The neighbourhood of related methods — select a node to explore.

Multimodal Doc2Vec

Doc2Vec التصنيف المعتمد على نموذ…تضمينات الجمل متعددة الو…المحولات متعددة الوسائط…Word2Vec متعدد الوسائط تضمينات الجمل

المصادر

Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link ↗
Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗

كيف تستشهد بهذه الصفحة

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/ar/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Doc2Vecتنقيب النصوص↔ compare
التصنيف المعتمد على نموذج BERT متعدد الوسائطالتعلم العميق↔ compare
تضمينات الجمل متعددة الوسائطالتعلم العميق↔ compare
المحولات متعددة الوسائط (Multimodal Transformers)التعلم العميق↔ compare
Word2Vec متعدد الوسائطالتعلم العميق↔ compare
تضمينات الجملالتعلم العميق↔ compare

Compare side by side →

يُستشهد بها في

Word2Vec متعدد الوسائط

هل لاحظت مشكلة في هذه الصفحة؟ أبلغ عنها أو اقترح تصحيحًا →