ScholarGate
Assistente

Análise Sintática e Formalismos Gramaticais

Recuperação da estrutura gramatical de frases por máquina: os formalismos gramaticais que descrevem estruturas válidas e os algoritmos que as computam, desde árvores de constituintes a grafos de dependência.

Encontrar tema com PaperMindEm breveFind papers & topics
Tools & resources
Baixar slides
Learn & explore
VídeoEm breve

Definition

Análise sintática é a atribuição computacional de estrutura gramatical a uma cadeia de entrada de acordo com uma gramática; formalismos gramaticais são os sistemas usados para especificar quais estruturas são válidas.

Scope

Abrange a análise sintática em linguística computacional — análise de constituintes livre de contexto e seus algoritmos probabilísticos e baseados em grafos (chart-based), análise de dependência, os principais formalismos gramaticais além das gramáticas livres de contexto simples, e as tarefas de rotulagem de sequência (como a etiquetagem de classes gramaticais) que alimentam a análise sintática. Exclui a interpretação semântica, que é tratada em semântica computacional, e a teoria de autômatos subjacente, abordada em fundamentos.

Sub-topics

Core questions

  • Como uma frase pode ter uma árvore sintática ou grafo de dependência atribuído eficientemente?
  • Quais formalismos gramaticais capturam adequadamente a sintaxe da linguagem natural?
  • Como as probabilidades ajudam a desambiguar entre muitas análises possíveis?
  • Como a etiquetagem e a segmentação (chunking) apoiam a análise sintática completa?

Key concepts

  • análise de constituintes
  • análise de dependência
  • gramática livre de contexto
  • análise por grafos (chart parsing)
  • gramática probabilística
  • etiquetagem de classes gramaticais
  • treebank
  • ambiguidade estrutural

Key theories

Análise por grafos (Chart parsing)
Algoritmos de programação dinâmica, como CKY e Earley, que computam todas as análises possíveis de uma frase em tempo polinomial, reutilizando subanálises compartilhadas.
Gramáticas probabilísticas livres de contexto
Atribuição de probabilidades a regras gramaticais para que a análise mais provável possa ser selecionada, abordando a ambiguidade estrutural generalizada da linguagem natural.

History

A análise sintática inicial baseava-se em gramáticas construídas manualmente e busca exaustiva; os algoritmos CKY e Earley tornaram a análise livre de contexto eficiente. O lançamento de treebanks na década de 1990 possibilitou a análise sintática probabilística orientada por dados, e os anos 2000 viram a análise de dependência ganhar destaque pela sua robustez interlinguística, posteriormente subsumida por analisadores neurais.

Debates

Representação por constituintes versus dependência
Se a sintaxe é melhor representada como frases aninhadas ou como relações rotuladas de cabeça-dependente; ambas são amplamente utilizadas, com a dependência favorecida para línguas com ordem de palavras livre e tarefas subsequentes.

Key figures

  • Jay Earley
  • Joakim Nivre
  • Christopher Manning
  • Mitchell Marcus

Related topics

Seminal works

  • manning1999
  • kubler2009
  • jurafsky2025

Frequently asked questions

Por que a análise sintática é difícil se as regras gramaticais são conhecidas?
As frases naturais são massivamente ambíguas: uma única cadeia pode ter muitas estruturas válidas. A análise sintática deve, portanto, não apenas encontrar estruturas, mas também classificá-las, razão pela qual modelos probabilísticos e aprendidos são essenciais.

Methods for this concept

Related concepts