语法形式体系
用于描述超越普通上下文无关规则的自然语言句法的更丰富的语法系统——树邻接语法、范畴语法和合一语法——在表达能力和可解析性之间取得平衡。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
语法形式体系是用于指定语言合法结构的系统,其特点在于其生成能力、表示手段以及解析的复杂性。
Scope
涵盖旨在捕捉上下文无关语法难以处理的句法现象的形式体系:树邻接语法(TAG)、组合范畴语法(CCG)以及合一或特征语法,如HPSG和LFG。它探讨了弱上下文敏感性(mild context-sensitivity)的概念以及语言充分性与计算可处理性之间的权衡。针对成分和依存关系的解析算法将单独介绍。
Core questions
- 哪些句法现象促使我们超越上下文无关语法?
- 什么是弱上下文敏感性,为什么它被认为是语言的恰当能力?
- 合一和特征如何让语法在结构中共享信息?
- 这些形式体系如何在表达能力和高效解析之间进行权衡?
Key concepts
- 树邻接语法
- 组合范畴语法
- 合一语法
- 特征结构
- 弱上下文敏感性
- HPSG
- LFG
- 次范畴化
Key theories
- 弱上下文敏感性
- 一类语法,包括TAG和CCG,其能力仅略微超出上下文无关语法,足以捕捉交叉序列依存关系,同时仍保持多项式时间可解析性。
- 组合范畴语法
- 一种词汇化形式体系,其中词语带有功能范畴,并通过一小组组合子进行组合,将句法与组合语义紧密结合。
- 合一语法
- 如HPSG等形式体系,将语言对象表示为通过合一组合的类型化特征结构,以声明方式捕捉一致性和次范畴化。
History
在20世纪80年代和90年代,语言学家开发了比上下文无关语法更丰富的形式体系,以捕捉一致性、长距离依存关系以及句法-语义接口。Joshi的树邻接语法形式化了弱上下文敏感性,而CCG和HPSG则提供了词汇化和基于合一的替代方案,这些方案在理论和计算工作中仍然具有影响力。
Debates
- 表达能力与可处理性
- 更强大的形式体系可以描述更多现象,但存在解析不可处理的风险;该领域通常倾向于使用足以涵盖数据的最小能力,因此对弱上下文敏感语法感兴趣。
Key figures
- Aravind Joshi
- Mark Steedman
- Carl Pollard
- Ivan Sag
Related topics
Seminal works
- joshi1997
- steedman2000
- pollard1994
Frequently asked questions
- 为什么不直接对所有情况都使用上下文无关语法?
- 某些结构,例如荷兰语和瑞士德语中的交叉序列依存关系,经证明无法由上下文无关语法生成。弱上下文敏感形式体系增加了恰到好处的能力来处理它们,同时保持高效可解析性。