ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodal navngitt enhetsgjenkjenning

Multimodal navngitt enhetsgjenkjenning (MNER) utvider klassisk NER ved å fusjonere tekstsekvenser med komplementære modaliteter — oftest bilder — for å forbedre identifisering og klassifisering av navngitte enheter som personer, organisasjoner og steder i sammenhenger der visuell kontekst avklarer tvetydige eller sparsomme tekster.

Åpne i MethodMindSnartVideoSnartLast ned lysbilder

Les hele metoden

Kun for medlemmer

Logg inn med en gratis konto for å lese denne delen.

Logg inn

Metodekart

Nabolaget av beslektede metoder — velg en node for å utforske.

Kilder

  1. Moon, S., Neves, L., & Carvalho, V. (2018). Multimodal Named Entity Recognition for Short Social Media Posts. Proceedings of NAACL-HLT 2018, pp. 852–860. Association for Computational Linguistics. link
  2. Lu, D., Neves, L., Carvalho, V., Zhang, N., & Ji, H. (2018). Visual Attention Model for Name Tagging in Multimodal Social Media. Proceedings of ACL 2018, pp. 1990–1999. Association for Computational Linguistics. link

Slik siterer du denne siden

ScholarGate. (2026, June 3). Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER). ScholarGate. https://scholargate.app/no/deep-learning/multimodal-named-entity-recognition

Hvilken metode?

Sett denne metoden ved siden av sin nærmeste slektning og les dem side om side — biblioteket legger bøkene på bordet; valget er ditt.

Sammenlign side om side
ScholarGateMultimodal Named Entity Recognition (Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER)). Hentet 2026-06-15 fra https://scholargate.app/no/deep-learning/multimodal-named-entity-recognition · Datasett: https://doi.org/10.5281/zenodo.20539026