การรู้จำสิ่งอ้างอิงจำเพาะหลายรูปแบบ
การรู้จำสิ่งอ้างอิงจำเพาะหลายรูปแบบ (Multimodal Named Entity Recognition - MNER) เป็นการต่อยอดการรู้จำสิ่งอ้างอิงจำเพาะ (NER) แบบดั้งเดิม โดยการหลอมรวมลำดับข้อความเข้ากับรูปแบบข้อมูลเสริม ซึ่งส่วนใหญ่คือรูปภาพ เพื่อปรับปรุงการระบุและการจำแนกสิ่งอ้างอิงจำเพาะ เช่น บุคคล องค์กร และสถานที่ ในบริบทที่ข้อมูลภาพช่วยขจัดความกำกวมของข้อความที่ไม่ชัดเจนหรือมีข้อมูลน้อย
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
แหล่งอ้างอิง
- Moon, S., Neves, L., & Carvalho, V. (2018). Multimodal Named Entity Recognition for Short Social Media Posts. Proceedings of NAACL-HLT 2018, pp. 852–860. Association for Computational Linguistics. link ↗
- Lu, D., Neves, L., Carvalho, V., Zhang, N., & Ji, H. (2018). Visual Attention Model for Name Tagging in Multimodal Social Media. Proceedings of ACL 2018, pp. 1990–1999. Association for Computational Linguistics. link ↗
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 3). Multimodal Named Entity Recognition (Text + Visual/Auxiliary Modality NER). ScholarGate. https://scholargate.app/th/deep-learning/multimodal-named-entity-recognition
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- การจำแนกประเภทโดยใช้ BERTการเรียนรู้เชิงลึก↔ compare
- การจำแนกประเภทแบบหลายรูปแบบโดยใช้ BERTการเรียนรู้เชิงลึก↔ compare
- การตอบคำถามหลายรูปแบบการเรียนรู้เชิงลึก↔ compare
- การฝังประโยคหลายรูปแบบการเรียนรู้เชิงลึก↔ compare
- Multimodal Transformerการเรียนรู้เชิงลึก↔ compare
- การรู้จำหน่วยคำนาม (Named Entity Recognition - NER)การทำเหมืองข้อความ↔ compare