Multimodal navngitt enhetsgjenkjenning
Multimodal navngitt enhetsgjenkjenning (MNER) utvider klassisk NER ved å fusjonere tekstsekvenser med komplementære modaliteter — oftest bilder — for å forbedre identifisering og klassifisering av navngitte enheter som personer, organisasjoner og steder i sammenhenger der visuell kontekst avklarer tvetydige eller sparsomme tekster.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Metodekart
Nabolaget av beslektede metoder — velg en node for å utforske.
Kilder
- Moon, S., Neves, L., & Carvalho, V. (2018). Multimodal Named Entity Recognition for Short Social Media Posts. Proceedings of NAACL-HLT 2018, pp. 852–860. Association for Computational Linguistics. link ↗
- Lu, D., Neves, L., Carvalho, V., Zhang, N., & Ji, H. (2018). Visual Attention Model for Name Tagging in Multimodal Social Media. Proceedings of ACL 2018, pp. 1990–1999. Association for Computational Linguistics. link ↗
Slik siterer du denne siden
ScholarGate. (2026, June 3). Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER). ScholarGate. https://scholargate.app/no/deep-learning/multimodal-named-entity-recognition
Hvilken metode?
Sett denne metoden ved siden av sin nærmeste slektning og les dem side om side — biblioteket legger bøkene på bordet; valget er ditt.
- BERT-basert klassifiseringDyp læring↔ sammenlign
- Multimodal BERT-basert klassifiseringDyp læring↔ sammenlign
- Multimodal spørsmålsbesvarelseDyp læring↔ sammenlign
- Multimodale setningsinnleiringerDyp læring↔ sammenlign
- Multimodal transformereDyp læring↔ sammenlign
- Navngitt enhetsgjenkjenning (NER)Tekstutvinning↔ sammenlign
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →