Análise Sintática e Formalismos Gramaticais
Recuperação da estrutura gramatical de frases por máquina: os formalismos gramaticais que descrevem estruturas válidas e os algoritmos que as computam, desde árvores de constituintes a grafos de dependência.
Definition
Análise sintática é a atribuição computacional de estrutura gramatical a uma cadeia de entrada de acordo com uma gramática; formalismos gramaticais são os sistemas usados para especificar quais estruturas são válidas.
Scope
Abrange a análise sintática em linguística computacional — análise de constituintes livre de contexto e seus algoritmos probabilísticos e baseados em grafos (chart-based), análise de dependência, os principais formalismos gramaticais além das gramáticas livres de contexto simples, e as tarefas de rotulagem de sequência (como a etiquetagem de classes gramaticais) que alimentam a análise sintática. Exclui a interpretação semântica, que é tratada em semântica computacional, e a teoria de autômatos subjacente, abordada em fundamentos.
Sub-topics
Core questions
- Como uma frase pode ter uma árvore sintática ou grafo de dependência atribuído eficientemente?
- Quais formalismos gramaticais capturam adequadamente a sintaxe da linguagem natural?
- Como as probabilidades ajudam a desambiguar entre muitas análises possíveis?
- Como a etiquetagem e a segmentação (chunking) apoiam a análise sintática completa?
Key concepts
- análise de constituintes
- análise de dependência
- gramática livre de contexto
- análise por grafos (chart parsing)
- gramática probabilística
- etiquetagem de classes gramaticais
- treebank
- ambiguidade estrutural
Key theories
- Análise por grafos (Chart parsing)
- Algoritmos de programação dinâmica, como CKY e Earley, que computam todas as análises possíveis de uma frase em tempo polinomial, reutilizando subanálises compartilhadas.
- Gramáticas probabilísticas livres de contexto
- Atribuição de probabilidades a regras gramaticais para que a análise mais provável possa ser selecionada, abordando a ambiguidade estrutural generalizada da linguagem natural.
History
A análise sintática inicial baseava-se em gramáticas construídas manualmente e busca exaustiva; os algoritmos CKY e Earley tornaram a análise livre de contexto eficiente. O lançamento de treebanks na década de 1990 possibilitou a análise sintática probabilística orientada por dados, e os anos 2000 viram a análise de dependência ganhar destaque pela sua robustez interlinguística, posteriormente subsumida por analisadores neurais.
Debates
- Representação por constituintes versus dependência
- Se a sintaxe é melhor representada como frases aninhadas ou como relações rotuladas de cabeça-dependente; ambas são amplamente utilizadas, com a dependência favorecida para línguas com ordem de palavras livre e tarefas subsequentes.
Key figures
- Jay Earley
- Joakim Nivre
- Christopher Manning
- Mitchell Marcus
Related topics
Seminal works
- manning1999
- kubler2009
- jurafsky2025
Frequently asked questions
- Por que a análise sintática é difícil se as regras gramaticais são conhecidas?
- As frases naturais são massivamente ambíguas: uma única cadeia pode ter muitas estruturas válidas. A análise sintática deve, portanto, não apenas encontrar estruturas, mas também classificá-las, razão pela qual modelos probabilísticos e aprendidos são essenciais.