Sprach- und Sprachanwendungen
Die angewandte Seite der Computerlinguistik: Umwandlung zwischen Sprache und Text, Extrahieren strukturierter Informationen aus Dokumenten und Aufbau von Systemen, die Fragen beantworten und Gespräche führen.
Definition
Sprach- und Sprachanwendungen sind Endbenutzersysteme, die menschliche Sprache wahrnehmen, verstehen oder produzieren und durch die Kombination von Methoden der Computerlinguistik erstellt werden.
Scope
Umfasst die Hauptanwendungsbereiche der Sprach- und Sprachtechnologie – automatische Spracherkennung, Text-to-Speech-Synthese, Informationsextraktion sowie Frage-Antwort- und Dialogsysteme. Es positioniert diese als integrative Aufgaben, die die Grundlagen des Fachgebiets, Parsing, Semantik und Lernmethoden kombinieren. Komponenten-Techniken werden in ihren jeweiligen Bereichen behandelt.
Sub-topics
Core questions
- Wie wird gesprochene Sprache in Text umgewandelt und umgekehrt?
- Wie werden strukturierte Informationen aus unstrukturierten Dokumenten extrahiert?
- Wie beantworten Systeme Fragen in natürlicher Sprache und führen Dialoge?
- Wie werden Anwendungssysteme für den realen Einsatz evaluiert?
Key concepts
- automatische Spracherkennung
- Text-to-Speech
- Informationsextraktion
- Named-Entity Recognition
- Fragebeantwortung
- Dialogsystem
- akustisches Modell
- Evaluierung
Key theories
- Noisy-Channel-Spracherkennung
- Die Rahmung der Erkennung als Wiederherstellung der wahrscheinlichsten Wortsequenz angesichts eines akustischen Signals durch die Kombination eines akustischen Modells und eines Sprachmodells.
- Pipeline des Sprachverständnisses
- Anwendungen komponieren Tokenisierung, Parsing, Semantik und Retrieval zu Pipelines oder End-to-End-Modellen, die Benutzereingaben in nützliche Antworten umwandeln.
History
Die Spracherkennung war ein wesentlicher Motor der frühen statistischen NLP, wobei gemeinsame Korpora wie die Wall Street Journal-Sammlung einen rigorosen Vergleich ermöglichten. Informationsextraktion und Fragebeantwortung entwickelten sich durch Evaluierungskampagnen in den 1990er und 2000er Jahren, und Dialogsysteme wurden zu Konsumgütern, als neuronale Methoden und große Sprachmodelle ausgereift waren.
Debates
- Pipelines versus End-to-End-Systeme
- Ob Anwendungen aus modularen linguistischen Komponenten aufgebaut oder End-to-End-Neuronale Systeme trainiert werden sollen; End-to-End-Ansätze dominieren, wo Daten reichlich vorhanden sind, bieten aber weniger Interpretierbarkeit.
Key figures
- Daniel Jurafsky
- James H. Martin
- Frederick Jelinek
- Janet Baker
Related topics
Seminal works
- paul1992
- manning1999
- jurafsky2025
Frequently asked questions
- Warum werden Sprach- und Textanwendungen zusammengefasst?
- Sie teilen die gleichen probabilistischen und neuronalen Grundlagen – Sprachmodelle, Sequenzmodellierung und Evaluierung – sodass für das eine entwickelte Techniken, wie die Sprachmodellierung in der Spracherkennung, leicht auf das andere übertragen werden können.