Warum war die maschinelle Übersetzung so wichtig für die Geschichte der NLP?

Die Übersetzung bot klare Ziele, reichlich parallele Daten und ein schwieriges Problem, das statistische und dann neuronale Methoden belohnte, sodass Fortschritte in der MT wiederholt den Fortschritt im gesamten Feld vorantrieben.

Maschinelle Übersetzung

Automatische Übersetzung von Texten von einer Sprache in eine andere, das Feld, das die statistische NLP durch Wortausrichtungsmodelle vorangetrieben hat und sich nun auf neuronale Sequenz-zu-Sequenz-Übersetzung stützt.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Maschinelle Übersetzung ist die automatische Umwandlung von Text oder Sprache aus einer Ausgangssprache in einen äquivalenten Ausdruck in einer Zielsprache.

Scope

Umfasst die automatische Übersetzung zwischen Sprachen: wort- und phrasenbasierte statistische Modelle, Alignment und das Noisy-Channel-Framework, neuronale maschinelle Übersetzung mit Attention und Transformatoren sowie die Bewertung der Übersetzungsqualität. Es behandelt die Übersetzung bei geringen Ressourcen und die mehrsprachige Übersetzung. Die allgemeine Transformer-Architektur wird in einem verwandten Thema behandelt.

Core questions

Wie rahmt das Noisy-Channel-Modell die Übersetzung als Suchproblem ein?
Wie werden Wort- und Phrasen-Alignments aus parallelen Korpora gelernt?
Wie übertraf die neuronale maschinelle Übersetzung phrasenbasierte Systeme?
Wie wird die Übersetzungsqualität automatisch und durch Menschen gemessen?

Key concepts

paralleler Korpus
Wort-Alignment
phrasenbasierte Übersetzung
Noisy-Channel-Modell
neuronale maschinelle Übersetzung
Subword-Einheiten
BLEU
Low-Resource-Übersetzung

Key theories

Statistische Wort-Alignment-Modelle: Die IBM-Modelle von Brown und Kollegen, die Wortkorrespondenzen aus parallelem Text lernen und die Übersetzung probabilistisch einrahmen, wodurch die statistische maschinelle Übersetzung begründet wurde.
Neuronale maschinelle Übersetzung: End-to-End-Encoder-Decoder-Modelle mit Attention, die ohne explizites Alignment oder Phrasentabellen übersetzen und Subword-Einheiten verwenden, um seltene Wörter zu verarbeiten.

History

Nach den Enttäuschungen früher regelbasierter Systeme führten die IBM-Modelle von Brown und Kollegen aus dem Jahr 1993 die statistische maschinelle Übersetzung ein, die zu phrasenbasierten Systemen verfeinert wurde, wie von Koehn dokumentiert. Die neuronale maschinelle Übersetzung entstand um 2014–2016 und entwickelte sich schnell zum Standard, der weit verbreitete Übersetzungsdienste antreibt.

Debates

Angemessenheit der automatischen Bewertung: Metriken wie BLEU ermöglichten schnelle Fortschritte, korrelieren jedoch unvollkommen mit menschlichen Beurteilungen von Flüssigkeit und Angemessenheit, wodurch die menschliche Bewertung für hochrangige Einschätzungen unerlässlich bleibt.

Key figures

Peter Brown
Robert Mercer
Philipp Koehn
Rico Sennrich

Seminal works

brown1993
papineni2002
sennrich2016

Frequently asked questions

Warum war die maschinelle Übersetzung so wichtig für die Geschichte der NLP?: Die Übersetzung bot klare Ziele, reichlich parallele Daten und ein schwieriges Problem, das statistische und dann neuronale Methoden belohnte, sodass Fortschritte in der MT wiederholt den Fortschritt im gesamten Feld vorantrieben.