Machine learningDeep learning / NLP / CV

تضمينات الجمل متعددة الوسائط

تقوم تضمينات الجمل متعددة الوسائط برسم خرائط للنصوص والصور (وأحيانًا الصوت أو الفيديو) في فضاء متجه مستمر مشترك، بحيث تتقارب الأزواج المرتبطة دلاليًا من الوسائط المختلفة. تُدرّب هذه التمثيلات بواسطة أهداف تباينية على مجموعات كبيرة من المدونات المقترنة، وتدعم الاسترجاع متعدد الوسائط، والتصنيف الصفري، والاستدلال البصري اللغوي.

افتح في MethodMindقريبًافيديوقريبًاDownload slides

اقرأ الطريقة كاملة

للأعضاء فقط

سجّل الدخول بحساب مجاني لقراءة هذا القسم.

تسجيل الدخول

Method map

The neighbourhood of related methods — select a node to explore.

تضمينات الجمل متعددة الوسائط

CLIP Multimodal Doc2Vec شبكة الرسم البياني متعدد…تصنيف الصور متعدد الوسائط شبكة بيرسيبترون متعددة ا…التعرف على الكيانات المس…إجابة الأسئلة متعددة الو…تصنيف RoBERTa متعدد الوس…نمذجة الموضوعات متعددة ا…Word2Vec متعدد الوسائط

المصادر

Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. In Proceedings of the 38th International Conference on Machine Learning (ICML), pp. 8748–8763. PMLR. link ↗
Frome, A., Corrado, G. S., Shlens, J., Bengio, S., Dean, J., Ranzato, M., & Mikolov, T. (2013). DeViSE: A deep visual-semantic embedding model. In Advances in Neural Information Processing Systems (NeurIPS), Vol. 26. link ↗

كيف تستشهد بهذه الصفحة

ScholarGate. (2026, June 3). Multimodal Sentence Embeddings (Joint Vision-Language Representation Learning). ScholarGate. https://scholargate.app/ar/deep-learning/multimodal-sentence-embeddings

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

CLIPالتعلم العميق↔ compare

Compare side by side →

يُستشهد بها في

Multimodal Doc2Vec شبكة الرسم البياني متعددة الوسائط تصنيف الصور متعدد الوسائط شبكة بيرسيبترون متعددة الطبقات متعددة الوسائط (MM-MLP)التعرف على الكيانات المسماة متعدد الوسائط إجابة الأسئلة متعددة الوسائط تصنيف RoBERTa متعدد الوسائط نمذجة الموضوعات متعددة الوسائط Word2Vec متعدد الوسائط

هل لاحظت مشكلة في هذه الصفحة؟ أبلغ عنها أو اقترح تصحيحًا →