ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodal Named Entity Recognition

Multimodal Named Entity Recognition (MNER) utökar klassisk NER genom att slå samman textsekvenser med kompletterande modaliteter – oftast bilder – för att förbättra identifieringen och klassificeringen av namngivna entiteter såsom personer, organisationer och platser i miljöer där visuell kontext avmystifierar tvetydiga eller sparsamma texter.

Öppna i MethodMindSnartVideoSnartDownload slides

Läs hela metoden

Endast för medlemmar

Logga in med ett kostnadsfritt konto för att läsa avsnittet.

Logga in

Method map

The neighbourhood of related methods — select a node to explore.

Källor

  1. Moon, S., Neves, L., & Carvalho, V. (2018). Multimodal Named Entity Recognition for Short Social Media Posts. Proceedings of NAACL-HLT 2018, pp. 852–860. Association for Computational Linguistics. link
  2. Lu, D., Neves, L., Carvalho, V., Zhang, N., & Ji, H. (2018). Visual Attention Model for Name Tagging in Multimodal Social Media. Proceedings of ACL 2018, pp. 1990–1999. Association for Computational Linguistics. link

Så citerar du den här sidan

ScholarGate. (2026, June 3). Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER). ScholarGate. https://scholargate.app/sv/deep-learning/multimodal-named-entity-recognition

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultimodal Named Entity Recognition (Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER)). Hämtad 2026-06-15 från https://scholargate.app/sv/deep-learning/multimodal-named-entity-recognition · Datamängd: https://doi.org/10.5281/zenodo.20539026