Maschinelle Übersetzung
Automatische Übersetzung von Texten von einer Sprache in eine andere, das Feld, das die statistische NLP durch Wortausrichtungsmodelle vorangetrieben hat und sich nun auf neuronale Sequenz-zu-Sequenz-Übersetzung stützt.
Definition
Maschinelle Übersetzung ist die automatische Umwandlung von Text oder Sprache aus einer Ausgangssprache in einen äquivalenten Ausdruck in einer Zielsprache.
Scope
Umfasst die automatische Übersetzung zwischen Sprachen: wort- und phrasenbasierte statistische Modelle, Alignment und das Noisy-Channel-Framework, neuronale maschinelle Übersetzung mit Attention und Transformatoren sowie die Bewertung der Übersetzungsqualität. Es behandelt die Übersetzung bei geringen Ressourcen und die mehrsprachige Übersetzung. Die allgemeine Transformer-Architektur wird in einem verwandten Thema behandelt.
Core questions
- Wie rahmt das Noisy-Channel-Modell die Übersetzung als Suchproblem ein?
- Wie werden Wort- und Phrasen-Alignments aus parallelen Korpora gelernt?
- Wie übertraf die neuronale maschinelle Übersetzung phrasenbasierte Systeme?
- Wie wird die Übersetzungsqualität automatisch und durch Menschen gemessen?
Key concepts
- paralleler Korpus
- Wort-Alignment
- phrasenbasierte Übersetzung
- Noisy-Channel-Modell
- neuronale maschinelle Übersetzung
- Subword-Einheiten
- BLEU
- Low-Resource-Übersetzung
Key theories
- Statistische Wort-Alignment-Modelle
- Die IBM-Modelle von Brown und Kollegen, die Wortkorrespondenzen aus parallelem Text lernen und die Übersetzung probabilistisch einrahmen, wodurch die statistische maschinelle Übersetzung begründet wurde.
- Neuronale maschinelle Übersetzung
- End-to-End-Encoder-Decoder-Modelle mit Attention, die ohne explizites Alignment oder Phrasentabellen übersetzen und Subword-Einheiten verwenden, um seltene Wörter zu verarbeiten.
History
Nach den Enttäuschungen früher regelbasierter Systeme führten die IBM-Modelle von Brown und Kollegen aus dem Jahr 1993 die statistische maschinelle Übersetzung ein, die zu phrasenbasierten Systemen verfeinert wurde, wie von Koehn dokumentiert. Die neuronale maschinelle Übersetzung entstand um 2014–2016 und entwickelte sich schnell zum Standard, der weit verbreitete Übersetzungsdienste antreibt.
Debates
- Angemessenheit der automatischen Bewertung
- Metriken wie BLEU ermöglichten schnelle Fortschritte, korrelieren jedoch unvollkommen mit menschlichen Beurteilungen von Flüssigkeit und Angemessenheit, wodurch die menschliche Bewertung für hochrangige Einschätzungen unerlässlich bleibt.
Key figures
- Peter Brown
- Robert Mercer
- Philipp Koehn
- Rico Sennrich
Related topics
Seminal works
- brown1993
- papineni2002
- sennrich2016
Frequently asked questions
- Warum war die maschinelle Übersetzung so wichtig für die Geschichte der NLP?
- Die Übersetzung bot klare Ziele, reichlich parallele Daten und ein schwieriges Problem, das statistische und dann neuronale Methoden belohnte, sodass Fortschritte in der MT wiederholt den Fortschritt im gesamten Feld vorantrieben.