Diskursverarbeitung und Koreferenz
Modellierung der Bedeutung oberhalb des Satzes: Auflösung, worauf Pronomen und Nominalphrasen sich beziehen, und Analyse, wie Sätze zu einem strukturierten, kohärenten Diskurs zusammenhängen.
Definition
Diskursverarbeitung ist die computergestützte Analyse von Bedeutungsbeziehungen, die sich über mehrere Sätze erstrecken, einschließlich der Referenzauflösung und der Struktur, die einen Text kohärent macht.
Scope
Umfasst die computergestützte Semantik auf Diskursebene – Koreferenz- und Anaphernresolution, Modelle lokaler Kohärenz wie die Centering-Theorie, Theorien der Diskursstruktur wie die Rhetorical Structure Theory und das Parsen von Diskursrelationen. Es behandelt, wie Referenz und Kohärenz über den Text hinweg verfolgt werden. Die satzinterne Bedeutung wird in verwandten Themen behandelt.
Core questions
- Wie werden Pronomen und Nominalphrasen mit ihren Referenten verknüpft?
- Was macht eine Abfolge von Sätzen zu einem kohärenten Diskurs?
- Wie kann die Diskursstruktur dargestellt und geparst werden?
- Wie unterstützen Diskursmodelle die Zusammenfassung und Beantwortung von Fragen?
Key concepts
- Koreferenzauflösung
- Anapher
- Centering-Theorie
- Diskurskohärenz
- Rhetorical Structure Theory
- Diskursrelation
- Salienz
- Diskurs-Parsing
Key theories
- Centering-Theorie
- Ein Modell, das beschreibt, wie sich die Aufmerksamkeit auf Diskurseinheiten zwischen Äußerungen verschiebt, und vorhersagt, welche Referenten am salientesten und somit wahrscheinliche Ziele von Pronomen sind.
- Rhetorical Structure Theory
- Analyse von Texten als Baum von Nukleus-Satelliten-Beziehungen wie Elaboration und Kontrast, die eine strukturelle Erklärung der Kohärenz liefert.
History
Die Diskursverarbeitung entwickelte sich in den 1980er und 1990er Jahren durch Theorien der Kohärenz und Aufmerksamkeit weiter, wobei die Centering-Theorie und die Rhetorical Structure Theory strukturierte Erklärungen dafür lieferten, wie Texte zusammenhängen. Die Koreferenzauflösung wurde zu einer standardmäßigen gemeinsamen Aufgabe, und das Diskurs-Parsing wurde später durch annotierte Korpora und neuronale Modelle vorangetrieben.
Debates
- Universalität von Diskursrelationen
- Ob es ein festes, theorienneutrales Inventar von Diskursrelationen gibt oder ob Relationen rahmenwerkspezifisch sind, eine Frage, die die Annotation und den Vergleich zwischen Korpora erschwert.
Key figures
- Barbara Grosz
- Aravind Joshi
- William Mann
- Sandra Thompson
Related topics
Seminal works
- grosz1995
- mann1988
Frequently asked questions
- Was ist Koreferenzauflösung?
- Koreferenzauflösung ist die Aufgabe, Ausdrücke in einem Text zu gruppieren, die sich auf dieselbe Entität beziehen, wie z. B. die Verknüpfung von „Marie Curie“, „sie“ und „die Physikerin“ mit einer Person, was für das Verständnis zusammenhängender Texte unerlässlich ist.