ScholarGate
Assistant

Traduction automatique

La traduction automatique de texte d'une langue à une autre, un domaine qui a propulsé le traitement automatique du langage naturel (TALN) statistique grâce aux modèles d'alignement de mots et qui repose désormais sur la traduction neuronale séquence-à-séquence.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

La traduction automatique est la conversion automatique de texte ou de parole d'une langue source vers une expression équivalente dans une langue cible.

Scope

Couvre la traduction automatique entre les langues : les modèles statistiques basés sur les mots et les phrases, l'alignement et le cadre du canal bruité, la traduction automatique neuronale avec attention et transformeurs, ainsi que l'évaluation de la qualité de la traduction. Il aborde la traduction multilingue et pour les langues à faibles ressources. L'architecture générale des transformeurs est traitée dans un sujet connexe.

Core questions

  • Comment le modèle du canal bruité conçoit-il la traduction comme un problème de recherche ?
  • Comment les alignements de mots et de phrases sont-ils appris à partir de corpus parallèles ?
  • Comment la traduction automatique neuronale a-t-elle surpassé les systèmes basés sur des phrases ?
  • Comment la qualité de la traduction est-elle mesurée automatiquement et par des humains ?

Key concepts

  • corpus parallèle
  • alignement de mots
  • traduction basée sur des phrases
  • modèle du canal bruité
  • traduction automatique neuronale
  • unités de sous-mots
  • BLEU
  • traduction pour les langues à faibles ressources

Key theories

Modèles statistiques d'alignement de mots
Les modèles IBM de Brown et ses collègues qui apprennent les correspondances de mots à partir de textes parallèles et formulent la traduction de manière probabiliste, fondant ainsi la traduction automatique statistique.
Traduction automatique neuronale
Modèles encodeur-décodeur de bout en bout avec mécanisme d'attention qui traduisent sans alignement explicite ni tables de phrases, utilisant des unités de sous-mots pour gérer les mots rares.

History

Après les déceptions des premiers systèmes basés sur des règles, les modèles IBM de Brown et ses collègues en 1993 ont lancé la traduction automatique statistique, affinée en systèmes basés sur des phrases documentés par Koehn. La traduction automatique neuronale est apparue vers 2014-2016, devenant rapidement la norme et alimentant les services de traduction largement utilisés.

Debates

Adéquation de l'évaluation automatique
Des métriques comme BLEU ont permis des progrès rapides mais corrèlent imparfaitement avec les jugements humains de fluidité et d'adéquation, rendant l'évaluation humaine essentielle pour les évaluations à enjeux élevés.

Key figures

  • Peter Brown
  • Robert Mercer
  • Philipp Koehn
  • Rico Sennrich

Related topics

Seminal works

  • brown1993
  • papineni2002
  • sennrich2016

Frequently asked questions

Pourquoi la traduction automatique a-t-elle été si importante dans l'histoire du TALN ?
La traduction a fourni des objectifs clairs, des données parallèles abondantes et un problème difficile qui a récompensé les méthodes statistiques puis neuronales, de sorte que les avancées en TA ont à plusieurs reprises stimulé les progrès dans l'ensemble du domaine.

Methods for this concept

Related concepts