Machine learningDeep learning / NLP / CV

การรู้จำสิ่งอ้างอิงจำเพาะหลายรูปแบบ

การรู้จำสิ่งอ้างอิงจำเพาะหลายรูปแบบ (Multimodal Named Entity Recognition - MNER) เป็นการต่อยอดการรู้จำสิ่งอ้างอิงจำเพาะ (NER) แบบดั้งเดิม โดยการหลอมรวมลำดับข้อความเข้ากับรูปแบบข้อมูลเสริม ซึ่งส่วนใหญ่คือรูปภาพ เพื่อปรับปรุงการระบุและการจำแนกสิ่งอ้างอิงจำเพาะ เช่น บุคคล องค์กร และสถานที่ ในบริบทที่ข้อมูลภาพช่วยขจัดความกำกวมของข้อความที่ไม่ชัดเจนหรือมีข้อมูลน้อย

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

แหล่งอ้างอิง

  1. Moon, S., Neves, L., & Carvalho, V. (2018). Multimodal Named Entity Recognition for Short Social Media Posts. Proceedings of NAACL-HLT 2018, pp. 852–860. Association for Computational Linguistics. link
  2. Lu, D., Neves, L., Carvalho, V., Zhang, N., & Ji, H. (2018). Visual Attention Model for Name Tagging in Multimodal Social Media. Proceedings of ACL 2018, pp. 1990–1999. Association for Computational Linguistics. link

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 3). Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER). ScholarGate. https://scholargate.app/th/deep-learning/multimodal-named-entity-recognition

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultimodal Named Entity Recognition (Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER)). สืบค้นเมื่อ 2026-06-15 จาก https://scholargate.app/th/deep-learning/multimodal-named-entity-recognition · ชุดข้อมูล: https://doi.org/10.5281/zenodo.20539026