Multimodal Named Entity Recognition
Multimodal Named Entity Recognition (MNER) udvider klassisk NER ved at fusionere tekstsekvenser med komplementære modaliteter – oftest billeder – for at forbedre identifikation og klassifikation af navngivne entiteter såsom personer, organisationer og lokationer i scenarier, hvor visuel kontekst disambiguerer tvetydig eller sparsom tekst.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Moon, S., Neves, L., & Carvalho, V. (2018). Multimodal Named Entity Recognition for Short Social Media Posts. Proceedings of NAACL-HLT 2018, pp. 852–860. Association for Computational Linguistics. link ↗
- Lu, D., Neves, L., Carvalho, V., Zhang, N., & Ji, H. (2018). Visual Attention Model for Name Tagging in Multimodal Social Media. Proceedings of ACL 2018, pp. 1990–1999. Association for Computational Linguistics. link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 3). Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER). ScholarGate. https://scholargate.app/da/deep-learning/multimodal-named-entity-recognition
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-baseret klassifikationDyb læring↔ compare
- Multimodal BERT-baseret klassifikationDyb læring↔ compare
- Multimodal Spørgsmål-SvarDyb læring↔ compare
- Multimodale sætningsindlejringerDyb læring↔ compare
- Multimodal TransformerDyb læring↔ compare
- Navngiven enhedsgenkendelse (NER)Tekstmining↔ compare
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →