Machine learningDeep learning / NLP / CV
التعرف على الكيانات المسماة متعدد الوسائط
يوسع التعرف على الكيانات المسماة متعدد الوسائط (MNER) التعرف الكلاسيكي على الكيانات المسماة (NER) عن طريق دمج التسلسلات النصية مع الوسائط التكميلية — الصور هي الأكثر شيوعًا — لتحسين تحديد وتصنيف الكيانات المسماة مثل الأشخاص والمنظمات والمواقع في البيئات التي يوضح فيها السياق البصري النص الغامض أو المتناثر.
اقرأ الطريقة كاملة
للأعضاء فقط
تسجيل الدخولسجّل الدخول بحساب مجاني لقراءة هذا القسم.
Method map
The neighbourhood of related methods — select a node to explore.
المصادر
- Moon, S., Neves, L., & Carvalho, V. (2018). Multimodal Named Entity Recognition for Short Social Media Posts. Proceedings of NAACL-HLT 2018, pp. 852–860. Association for Computational Linguistics. link ↗
- Lu, D., Neves, L., Carvalho, V., Zhang, N., & Ji, H. (2018). Visual Attention Model for Name Tagging in Multimodal Social Media. Proceedings of ACL 2018, pp. 1990–1999. Association for Computational Linguistics. link ↗
كيف تستشهد بهذه الصفحة
ScholarGate. (2026, June 3). Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER). ScholarGate. https://scholargate.app/ar/deep-learning/multimodal-named-entity-recognition
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- تصنيف قائم على BERTالتعلم العميق↔ compare
- التصنيف المعتمد على نموذج BERT متعدد الوسائطالتعلم العميق↔ compare
- إجابة الأسئلة متعددة الوسائطالتعلم العميق↔ compare
- تضمينات الجمل متعددة الوسائطالتعلم العميق↔ compare
- المحولات متعددة الوسائط (Multimodal Transformers)التعلم العميق↔ compare
- التعرف على الكيانات المسماة (NER)تنقيب النصوص↔ compare