ScholarGate
助手

词汇语义学与词义消歧

词义的计算研究:解决词语在上下文中携带的意义,衡量语义相似性,以及建模词义之间的关系。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

计算语言学中的词汇语义学是指机器对词义的表示、比较和消歧。

Scope

涵盖单个词语的意义及其关系——词义清单、词义消歧、语义相似性和关联性,以及词汇意义的分布式模型。它涉及使用WordNet等资源的基于知识的方法,以及基于语料库和神经网络的方法。组合句义在相关主题中有所涵盖。

Core questions

  • 如何根据上下文确定词语的意义?
  • 如何量化词语之间的语义相似性?
  • 基于知识和基于语料库的词汇意义方法有何不同?
  • 如何通过计算处理多义性和隐喻?

Key concepts

  • 词义
  • 多义性
  • 词义清单
  • 词义消歧
  • 语义相似性
  • 分布式语义学
  • 向量空间模型
  • 词汇关系

Key theories

词义消歧
利用上下文、知识资源或学习分类器,从词义清单中选择歧义词在上下文中合适的意义。
分布式词汇意义
通过共现统计和关联度量来表示词义,使得语义相关的词语具有相似的上下文特征。

History

词义消歧是一个长期存在的挑战,Navigli在2009年对其进行了全面综述。分布式方法植根于Harris的假设,并由Church和Hanks的关联度量推进,逐渐提供了现在主导词汇语义学的数据驱动相似性模型。

Debates

离散意义与连续意义
词义是最好建模为离散意义的固定清单,还是连续空间,这种张力因模糊意义边界的上下文嵌入而加剧。

Key figures

  • Roberto Navigli
  • Kenneth Church
  • Hinrich Schütze
  • Zellig Harris

Related topics

Seminal works

  • navigli2009
  • church1989

Frequently asked questions

为什么词义消歧很困难?
许多词语有多种意义,选择正确的意义通常需要广泛的常识和微妙的上下文线索,这些很难编码,这也是它几十年来一直是一个基准挑战的原因。

Methods for this concept

Related concepts