Statistisches und neuronales NLP
Der datengestützte Kern der modernen Computerlinguistik: maschinelle Lernmethoden, die aus Texten lernen, von statistischen Klassifikatoren und Worteinbettungen bis hin zu transformatorbasierten neuronalen Netzen und großen Sprachmodellen.
Definition
Statistisches und neuronales NLP ist der Bereich der maschinellen Lernmethoden, die Sprachverarbeitungsfähigkeiten aus Daten ableiten, anstatt aus handgeschriebenen Regeln.
Scope
Behandelt die lernbasierten Methoden, die die zeitgenössische NLP dominieren – überwachte Textklassifikation, verteilte Wortrepräsentationen und neuronale Sprachmodelle, Sequenz-zu-Sequenz- und Transformer-Architekturen sowie die maschinelle Übersetzung als Vorzeigeanwendung. Es verortet die statistische Revolution der 1990er Jahre und die neuronale Revolution der 2010er Jahre als eine kontinuierliche Entwicklung. Linguistische Repräsentation und Anwendungen werden in angrenzenden Bereichen behandelt.
Sub-topics
Core questions
- Wie werden Sprachaufgaben als Probleme des überwachten Lernens formuliert?
- Wie erfassen verteilte Repräsentationen die Bedeutung von Wörtern und Sätzen?
- Was machte die Transformer-Architektur so effektiv für die Sprache?
- Wie kamen statistische und dann neuronale Methoden dazu, das Feld zu dominieren?
Key concepts
- überwachtes Lernen
- Merkmalsrepräsentation
- Worteinbettung
- neuronales Netz
- Self-Attention
- Transformer
- Transferlernen
- großes Sprachmodell
Key theories
- Distributionelles Repräsentationslernen
- Repräsentation von Wörtern und Texten als dichte Vektoren, die aus dem gemeinsamen Vorkommen in großen Korpora gelernt werden, sodass semantische Ähnlichkeit zu geometrischer Nähe wird.
- Self-Attention und Transformer
- Eine Architektur, die Beziehungen zwischen allen Token in einer Sequenz durch Attention modelliert, was ein hochparalleles Training ermöglicht und moderne große Sprachmodelle untermauert.
History
Die statistische Revolution der 1990er Jahre ersetzte handgefertigte Regeln durch probabilistische Modelle, die aus Korpora geschätzt wurden. Worteinbettungen und rekurrente Netze in den frühen 2010er Jahren, gefolgt vom Transformer im Jahr 2017 und großen vortrainierten Modellen, führten zu schnellen Fortschritten bei nahezu jeder Aufgabe und gestalteten die Disziplin um gelernte Repräsentationen neu.
Debates
- Verstehen neuronale Modelle Sprache?
- Ob große neuronale Modelle echte linguistische Kompetenz und Bedeutung erfassen oder Oberflächenstatistiken ausnutzen; diese Frage treibt die laufende Arbeit an Interpretierbarkeit und Evaluation voran.
Key figures
- Christopher Manning
- Yoshua Bengio
- Ashish Vaswani
- Tomas Mikolov
Related topics
Seminal works
- manning1999
- vaswani2017
- jurafsky2025
Frequently asked questions
- Ist statistisches NLP obsolet, da es jetzt neuronale Modelle gibt?
- Nein. Neuronales NLP basiert auf denselben statistischen Grundlagen – Wahrscheinlichkeit, Schätzung und Evaluation – und viele Ideen wie Glättung, Klassifikation und Sprachmodellierung übertragen sich direkt auf den neuronalen Kontext.