Multimodal Named Entity Recognition
Multimodal Named Entity Recognition (MNER) utökar klassisk NER genom att slå samman textsekvenser med kompletterande modaliteter – oftast bilder – för att förbättra identifieringen och klassificeringen av namngivna entiteter såsom personer, organisationer och platser i miljöer där visuell kontext avmystifierar tvetydiga eller sparsamma texter.
Läs hela metoden
Logga in med ett kostnadsfritt konto för att läsa avsnittet.
Method map
The neighbourhood of related methods — select a node to explore.
Källor
- Moon, S., Neves, L., & Carvalho, V. (2018). Multimodal Named Entity Recognition for Short Social Media Posts. Proceedings of NAACL-HLT 2018, pp. 852–860. Association for Computational Linguistics. link ↗
- Lu, D., Neves, L., Carvalho, V., Zhang, N., & Ji, H. (2018). Visual Attention Model for Name Tagging in Multimodal Social Media. Proceedings of ACL 2018, pp. 1990–1999. Association for Computational Linguistics. link ↗
Så citerar du den här sidan
ScholarGate. (2026, June 3). Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER). ScholarGate. https://scholargate.app/sv/deep-learning/multimodal-named-entity-recognition
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-baserad klassificeringDjupinlärning↔ compare
- Multimodal BERT-baserad klassificeringDjupinlärning↔ compare
- Multimodal Question AnsweringDjupinlärning↔ compare
- Multimodala meningsinbäddningarDjupinlärning↔ compare
- Multimodal TransformerDjupinlärning↔ compare
- Namngiven entitetsigenkänning (NER)Textutvinning↔ compare
Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →