ScholarGate
Assistent

Syntaktisches Parsing

Syntaktisches Parsing ist die Aufgabe, die grammatische Struktur eines Satzes wiederherzustellen, indem ihm ein Konstituentenbaum oder eine Dependenzstruktur zugewiesen wird, die zeigt, wie Wörter sich kombinieren und zueinander in Beziehung stehen.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Syntaktisches Parsing bildet einen Satz auf eine Darstellung seiner grammatischen Struktur ab – typischerweise einen Konstituentenbaum (Phasenstruktur) oder einen Dependenzgraphen – gemäß einer Grammatik oder einem Modell, das aus annotierten Daten gelernt wurde.

Scope

Dieses Thema umfasst die Analyse der Satzstruktur: kontextfreie und reichere Grammatiken, Konstituenten-Parsing (Phasenstruktur-Bäume) und Dependenz-Parsing (Kopf-Dependenz-Beziehungen), klassische Chart-Parsing-Algorithmen wie CKY und Earley sowie probabilistisches und datengesteuertes Parsing, das auf Treebanks trainiert wurde. Es behandelt, wie syntaktische Ambiguität dargestellt und aufgelöst wird. Die nachgelagerte Verwendung syntaktischer Strukturen zur Bedeutungsberechnung wird unter Computerlinguistik behandelt.

Core questions

  • Wie wird die grammatische Struktur eines Satzes dargestellt, als Konstituenten oder als Dependenzen?
  • Wie untersuchen Chart-Parsing-Algorithmen effizient die vielen möglichen Analysen eines Satzes?
  • Wie wird syntaktische Ambiguität behandelt, und wie wählen probabilistische Modelle zwischen Parsings aus?
  • Wie werden Parser mithilfe annotierter Korpora (Treebanks) trainiert und evaluiert?

Key concepts

  • Konstituentenbäume (Phasenstruktur)
  • Dependenzstrukturen
  • kontextfreie Grammatik
  • CKY- und Earley-Parsing
  • probabilistische kontextfreie Grammatik
  • syntaktische Ambiguität
  • Treebanks
  • Part-of-Speech-Tags

Key theories

Kontextfreie Grammatiken und Chart-Parsing
Kontextfreie Grammatiken modellieren die Phasenstruktur, und dynamische Chart-Parser wie die CKY- und Earley-Algorithmen finden alle gültigen Parsings in polynomialer Zeit, indem sie Analysen von Teilspannen wiederverwenden.
Probabilistisches Parsing
Die Zuweisung von Wahrscheinlichkeiten zu Grammatikregeln (wie bei probabilistischen kontextfreien Grammatiken) ermöglicht es einem Parser, konkurrierende Analysen zu bewerten und die wahrscheinlichste Struktur auszuwählen, wodurch die allgegenwärtige Ambiguität der Syntax natürlicher Sprachen adressiert wird.
Treebanks und datengesteuertes Parsing
Große annotierte Korpora wie das Penn Treebank lieferten die Trainings- und Evaluierungsdaten, die das Parsing zu einer datengesteuerten Aufgabe machten und statistische und später neuronale Parser ermöglichten, die aus von Menschen annotierten Strukturen gelernt wurden.

Clinical relevance

Syntaktisches Parsing unterstützt die Grammatikprüfung, Informationsgewinnung, Beantwortung von Fragen und maschinelle Übersetzung, indem es aufzeigt, wie Wörter gruppiert sind und zueinander in Beziehung stehen; insbesondere die Dependenzstruktur wird häufig als Eingabe für nachgelagerte semantische und Extraktionssysteme verwendet.

History

Das Parsing baute auf Chomskys formalen Grammatiken auf; die CKY- (1960er) und Earley-Algorithmen (1970) ermöglichten ein effizientes kontextfreies Parsing. Das Penn Treebank (1993) katalysierte das statistische Parsing, und probabilistische und später neuronale Parser verbesserten schrittweise die Genauigkeit und Robustheit bei realem Text.

Key figures

  • Noam Chomsky
  • Tadao Kasami
  • Jay Earley
  • Mitchell P. Marcus
  • Christopher D. Manning

Related topics

Seminal works

  • marcus1993
  • jurafsky2023

Frequently asked questions

Was ist der Unterschied zwischen Konstituenten- und Dependenz-Parsing?
Konstituenten-Parsing gruppiert Wörter in verschachtelte Phrasen (wie Nominalphrasen und Verbalphrasen) und erzeugt einen Baum von Konstituenten. Dependenz-Parsing verknüpft stattdessen jedes Wort mit dem Wort, von dem es abhängt (seinem Kopf), und erzeugt einen Graphen grammatischer Beziehungen. Beide erfassen die syntaktische Struktur, betonen jedoch unterschiedliche Aspekte.
Warum ist Parsing schwierig, obwohl Grammatiken gut definiert sind?
Sätze in natürlicher Sprache sind hochgradig mehrdeutig: Ein einzelner Satz kann viele grammatisch gültige Strukturen haben, und die Anzahl kann mit der Satzlänge schnell ansteigen. Die Auswahl der beabsichtigten Analyse erfordert statistische oder gelernte Präferenzen, nicht nur eine Grammatik, was das Parsing zu einer Herausforderung macht.

Methods for this concept

Related concepts