词汇数据库和本体
词义及其关系的机器可读清单——WordNet、FrameNet及相关本体——为计算系统提供了对词汇语义的结构化访问。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
词汇数据库或本体是一种结构化资源,它以计算机程序可用的形式记录词义及其之间的语义关系。
Scope
涵盖词汇语义资源的设计和使用:WordNet的同义词集和层级关系,FrameNet的语义框架和角色,以及更广泛的计算本体。它探讨了这些资源如何编码同义关系、上位词关系和谓词-论元结构,以及它们如何支持消歧和推理。分布式和神经词汇语义在计算语义学中有所涵盖。
Core questions
- WordNet如何将词义组织成通过词汇关系连接的同义词集?
- FrameNet如何通过框架和角色来表示意义?
- 这些资源如何用于词义消歧和相似性判断?
- 人工构建的词汇本体的局限性是什么?
Key concepts
- 同义词集
- 上位词和下位词
- 部分整体关系
- 语义框架
- 框架元素
- 词义消歧
- 词汇本体
- 谓词-论元结构
Key theories
- 基于同义词集的词汇组织
- 将词汇建模为通过上位词和部分整体关系等连接的同义词集合(同义词集),如WordNet中所示,赋予词义图结构。
- 框架语义学
- 通过词汇所唤起的语境(框架)及其内部的参与者角色来表示词义,并在FrameNet中作为词汇资源进行操作化。
History
WordNet由George Miller的团队于1980年代启动,并于1995年和1998年有文献记载,成为计算语言学中使用最广泛的词汇资源。Fillmore的框架语义学在1990年代后期被操作化为FrameNet,通过明确的谓词-论元结构补充了WordNet。
Debates
- 人工构建资源与学习表示
- 在学习嵌入的时代,精心策划的词汇数据库是否仍然有价值;许多人认为它们仍然提供可解释的结构和分布式模型所缺乏的真实情况。
Key figures
- George Miller
- Christiane Fellbaum
- Charles Fillmore
- Collin Baker
Related topics
Seminal works
- miller1995
- fellbaum1998
- baker1998
Frequently asked questions
- WordNet中的同义词集是什么?
- 同义词集是一组在某些语境下可互换的词——同义词——它们被归类为一个单一概念,并通过“是-a”和“部分-of”等关系与其他同义词集连接。