什么是命名实体识别？

命名实体识别在文本中查找并分类专有名词跨度，例如人名、组织名和地名。它通常是文档中抽取关系和事件的第一步。

信息抽取

将非结构化文本转化为结构化数据：检测命名实体、它们之间的关系以及它们参与的事件，从而可以对文档进行查询和聚合。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

Learn & explore

视频即将推出

信息抽取是从非结构化自然语言文本中自动识别结构化事实——实体、关系和事件。

涵盖从文本中提取结构化信息——命名实体识别、关系抽取、事件抽取以及时间信息和模板填充。它涉及基于规则和基于学习的方法，以及由共享任务建立的评估传统。底层的序列标注模型在解析领域中有所涵盖。

信息抽取受到20世纪90年代消息理解会议（Message Understanding Conferences）的影响，该会议定义了命名实体和模板填充任务及其评估。该领域从手工构建的模式发展到统计序列模型（如条件随机场），然后发展到大规模的神经网络和远程监督抽取。