Analyse syntaxique par dépendances
Analyse de la structure des phrases sous forme de relations de dépendance étiquetées entre les mots, à l'aide d'algorithmes basés sur les transitions et sur les graphes, de plus en plus selon la norme interlingue des Dépendances Universelles.
Definition
L'analyse syntaxique par dépendances attribue à une phrase un graphe orienté dans lequel chaque mot est lié à sa tête syntaxique par une relation grammaticale étiquetée.
Scope
Couvre les représentations syntaxiques par dépendances, l'analyse syntaxique basée sur les transitions (décalage-réduction avec un oracle), l'analyse syntaxique basée sur les graphes (arbre couvrant maximal), la projectivité, et le schéma d'annotation des Dépendances Universelles qui permet des corpus arborés interlinguistiques cohérents. Il aborde l'évaluation par le score d'attachement. L'analyse syntaxique par constituants et les formalismes plus larges sont traités dans des sujets connexes.
Core questions
- Comment les analyseurs basés sur les transitions construisent-ils un arbre de dépendances de manière incrémentale ?
- Comment l'analyse syntaxique basée sur les graphes trouve-t-elle l'arbre optimal en tant qu'arbre couvrant maximal ?
- Qu'est-ce que la projectivité et pourquoi complique-t-elle l'analyse syntaxique ?
- Comment les Dépendances Universelles rendent-elles les annotations comparables entre les langues ?
Key concepts
- relation de dépendance
- tête et dépendant
- analyse syntaxique basée sur les transitions
- analyse syntaxique basée sur les graphes
- projectivité
- arbre couvrant maximal
- Dépendances Universelles
- score d'attachement
Key theories
- Analyse syntaxique par dépendances basée sur les transitions
- Construction d'un arbre de dépendances par une séquence d'actions de décalage et de réduction choisies par un classifieur appris, permettant une analyse en temps linéaire.
- Dépendances Universelles
- Un inventaire interlinguistique cohérent de relations de dépendance et de directives d'annotation qui permet de comparer et de transférer des corpus arborés et des analyseurs entre les langues.
History
La grammaire de dépendance trouve ses origines dans les travaux de Tesnière au milieu du XXe siècle, mais sa forme computationnelle a mûri dans les années 2000 avec les analyseurs basés sur les transitions de Nivre et les analyseurs basés sur les graphes de McDonald. Le projet Universal Dependencies, lancé au milieu des années 2010, a unifié l'annotation dans plus d'une centaine de langues.
Debates
- Analyse syntaxique basée sur les transitions versus analyse syntaxique basée sur les graphes
- Les analyseurs basés sur les transitions sont rapides mais peuvent commettre des erreurs locales, tandis que les analyseurs basés sur les graphes optimisent globalement à un coût plus élevé ; les méthodes neuronales ont réduit mais n'ont pas éliminé ce compromis.
Key figures
- Joakim Nivre
- Ryan McDonald
- Marie-Catherine de Marneffe
- Lucien Tesnière
Related topics
Seminal works
- nivre2008
- demarneffe2021
- kubler2009
Frequently asked questions
- Que signifie la projectivité ?
- Un arbre de dépendances est projectif lorsque ses arcs peuvent être tracés au-dessus de la phrase sans se croiser. Les structures non projectives, courantes dans les langues à ordre des mots libre, nécessitent des algorithmes d'analyse syntaxique qui permettent les dépendances croisées.