ScholarGate
Ассистент

Синтаксический анализ зависимостей

Анализ структуры предложения как размеченных отношений «главное слово — зависимое слово» между словами, с использованием алгоритмов, основанных на переходах и на графах, все чаще в соответствии с кросс-лингвистическим стандартом Universal Dependencies.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Синтаксический анализ зависимостей присваивает предложению ориентированный граф, в котором каждое слово связано со своим синтаксическим центром размеченным грамматическим отношением.

Scope

Охватывает представления синтаксиса зависимостей, синтаксический анализ, основанный на переходах (сдвиг-свертка с оракулом), синтаксический анализ, основанный на графах (максимальное остовное дерево), проективность и схему аннотации Universal Dependencies, которая обеспечивает согласованные кросс-лингвистические корпусы деревьев. Рассматривается оценка по показателю присоединения (attachment score). Синтаксический анализ составляющих и более широкие формализмы рассматриваются в смежных темах.

Core questions

  • Как парсеры, основанные на переходах, инкрементально строят дерево зависимостей?
  • Как синтаксический анализ, основанный на графах, находит оптимальное дерево как максимальное остовное дерево?
  • Что такое проективность и почему она усложняет синтаксический анализ?
  • Как Universal Dependencies делает аннотации сопоставимыми между языками?

Key concepts

  • отношение зависимости
  • главное и зависимое слово
  • синтаксический анализ, основанный на переходах
  • синтаксический анализ, основанный на графах
  • проективность
  • максимальное остовное дерево
  • Universal Dependencies
  • показатель присоединения

Key theories

Синтаксический анализ зависимостей, основанный на переходах
Построение дерева зависимостей путем последовательности операций сдвига и свертки, выбранных обученным классификатором, что обеспечивает синтаксический анализ за линейное время.
Universal Dependencies
Кросс-лингвистически согласованный набор отношений зависимостей и правил аннотации, который позволяет сравнивать и переносить корпусы деревьев и парсеры между языками.

History

Грамматика зависимостей восходит к работе Тесньера середины 20-го века, но ее вычислительная форма сформировалась в 2000-х годах с появлением парсеров, основанных на переходах, Нивре и парсеров, основанных на графах, Макдональда. Проект Universal Dependencies, запущенный в середине 2010-х годов, унифицировал аннотации для более чем ста языков.

Debates

Синтаксический анализ, основанный на переходах, против синтаксического анализа, основанного на графах
Парсеры, основанные на переходах, быстры, но могут совершать локальные ошибки, в то время как парсеры, основанные на графах, оптимизируют глобально с более высокими затратами; нейронные методы сузили, но не устранили этот компромисс.

Key figures

  • Joakim Nivre
  • Ryan McDonald
  • Marie-Catherine de Marneffe
  • Lucien Tesnière

Related topics

Seminal works

  • nivre2008
  • demarneffe2021
  • kubler2009

Frequently asked questions

Что означает проективность?
Дерево зависимостей является проективным, когда его дуги могут быть нарисованы над предложением без пересечений. Непроективные структуры, распространенные в языках со свободным порядком слов, требуют алгоритмов синтаксического анализа, которые допускают пересекающиеся зависимости.

Methods for this concept

Related concepts