Грамматические формализмы
Более богатые грамматические системы, используемые для описания синтаксиса естественного языка за пределами простых контекстно-свободных правил — древовидно-смежные, категориальные и основанные на унификации грамматики — которые балансируют между выразительностью и возможностью синтаксического анализа.
Definition
Грамматический формализм — это система для спецификации допустимых структур языка, характеризующаяся своей порождающей мощностью, своими репрезентативными средствами и сложностью синтаксического анализа.
Scope
Охватывает формализмы, разработанные для фиксации синтаксических явлений, которые контекстно-свободные грамматики обрабатывают неудобно: древовидно-смежная грамматика (TAG), комбинаторная категориальная грамматика (CCG) и грамматики, основанные на унификации или признаках, такие как HPSG и LFG. Рассматривается понятие слабой контекстно-зависимости и компромисс между лингвистической адекватностью и вычислительной разрешимостью. Алгоритмы синтаксического анализа, специфичные для составляющих и зависимостей, рассматриваются отдельно.
Core questions
- Какие синтаксические явления мотивируют выход за рамки контекстно-свободных грамматик?
- Что такое слабая контекстно-зависимость и почему она считается подходящей мощностью для языка?
- Как унификация и признаки позволяют грамматикам обмениваться информацией в рамках структуры?
- Как эти формализмы балансируют выразительность и эффективность синтаксического анализа?
Key concepts
- древовидно-смежная грамматика
- комбинаторная категориальная грамматика
- грамматика унификации
- структура признаков
- слабая контекстно-зависимость
- HPSG
- LFG
- субкатегоризация
Key theories
- Слабая контекстно-зависимость
- Класс грамматик, включая TAG и CCG, который превышает мощность контекстно-свободных грамматик ровно настолько, чтобы фиксировать перекрестные зависимости, оставаясь при этом полиномиально анализируемым.
- Комбинаторная категориальная грамматика
- Лексикализованный формализм, в котором слова несут функциональные категории, комбинируемые небольшим набором комбинаторов, тесно связывая синтаксис с композиционной семантикой.
- Грамматика, основанная на унификации
- Формализмы, такие как HPSG, которые представляют лингвистические объекты как типизированные структуры признаков, комбинируемые унификацией, декларативно фиксируя согласование и субкатегоризацию.
History
В течение 1980-х и 1990-х годов лингвисты разрабатывали формализмы, более богатые, чем контекстно-свободные грамматики, для фиксации согласования, дальнодействующих зависимостей и интерфейса синтаксис-семантика. Древовидно-смежная грамматика Джоши формализовала слабую контекстно-зависимость, в то время как CCG и HPSG предложили лексикализованные и основанные на унификации альтернативы, которые остаются влиятельными как в теоретической, так и в вычислительной работе.
Debates
- Выразительность против разрешимости
- Более мощные формализмы могут описывать больше явлений, но рискуют сделать синтаксический анализ неразрешимым; область в целом предпочитает наименьшую мощность, достаточную для охвата данных, отсюда интерес к слабо контекстно-зависимым грамматикам.
Key figures
- Aravind Joshi
- Mark Steedman
- Carl Pollard
- Ivan Sag
Related topics
Seminal works
- joshi1997
- steedman2000
- pollard1994
Frequently asked questions
- Почему бы просто не использовать контекстно-свободные грамматики для всего?
- Некоторые конструкции, такие как перекрестные зависимости в голландском и швейцарском немецком языках, доказуемо не могут быть сгенерированы контекстно-свободными грамматиками. Слабо контекстно-зависимые формализмы добавляют ровно столько мощности, чтобы справиться с ними, оставаясь при этом эффективно анализируемыми.