Que mesure le score BLEU ?

BLEU mesure le degré de chevauchement d'une traduction automatique, en termes de séquences de mots correspondantes (n-grammes), avec une ou plusieurs traductions de référence humaines, avec une pénalité pour les traductions trop courtes. Il corrèle raisonnablement avec les jugements humains et permet une comparaison automatique rapide, bien qu'il ne saisisse pas entièrement le sens ou la fluidité.

Pourquoi la traduction automatique est-elle considérée comme difficile ?

Les langues diffèrent par leur vocabulaire, l'ordre des mots, leur morphologie et les distinctions qu'elles exigent, et les mots et phrases individuels sont souvent ambigus. Produire une traduction à la fois fidèle au sens de la source et naturelle dans la langue cible nécessite de résoudre ces problèmes simultanément, ce qui est difficile.

Traduction automatique

La traduction automatique est la conversion automatique de texte ou de parole d'une langue naturelle à une autre, l'une des applications les plus anciennes et les plus importantes du traitement automatique du langage naturel.

Trouver un sujet avec PaperMindBientôtFind papers & topics

Tools & resources

Télécharger les diapositives

Learn & explore

VidéoBientôt

Definition

La traduction automatique est la tâche de produire, pour une phrase dans une langue source, une phrase équivalente dans une langue cible, en utilisant des systèmes qui peuvent être basés sur des règles, statistiques ou neuronaux, et évalués en termes d'adéquation et de fluidité.

Scope

Ce sujet couvre les approches de la traduction automatique : les systèmes basés sur des règles et interlingua, la traduction automatique statistique basée sur les mots et les expressions avec des modèles d'alignement et des modèles de langue, et le paradigme neuronal séquence-à-séquence ; ainsi que les problèmes centraux de l'alignement des mots, de la fluidité versus l'adéquation, et de l'évaluation automatique avec des métriques telles que BLEU. Il aborde les raisons pour lesquelles la traduction est difficile (ambiguïté, divergence entre les langues, ordre des mots) et la manière dont la qualité est mesurée. Les méthodes générales d'entraînement des réseaux neuronaux appartiennent au sous-domaine de l'apprentissage automatique.

Core questions

Qu'est-ce qui rend la traduction difficile, compte tenu de l'ambiguïté lexicale et de la divergence structurelle entre les langues ?
Comment les correspondances de mots et d'expressions (alignements) sont-elles apprises à partir de textes parallèles ?
Comment les modèles de traduction statistiques et neuronaux concilient-ils l'adéquation et la fluidité ?
Comment la qualité de la traduction est-elle mesurée automatiquement et de manière fiable ?

Key concepts

langue source et langue cible
corpus parallèles
alignement de mots et d'expressions
modèle de traduction et modèle de langue
traduction automatique statistique
traduction neuronale séquence-à-séquence
adéquation et fluidité
BLEU et évaluation automatique

Key theories

Traduction automatique statistique: La TA statistique modélise la traduction comme la recherche de la phrase cible qui maximise la probabilité étant donné la source, décomposée via un modèle de traduction appris à partir d'alignements de mots/expressions dans des corpus parallèles et un modèle de langue cible pour la fluidité.
Alignement de mots: Apprendre quels mots sources correspondent à quels mots cibles à partir de textes parallèles (les modèles d'alignement d'IBM) est un composant fondamental qui relie les deux langues et soutient l'extraction d'expressions.
Évaluation automatique: Des métriques telles que BLEU comparent la sortie du système à des traductions de référence humaines par chevauchement de n-grammes, permettant une évaluation rapide et reproductible qui a favorisé le progrès, tout en reconnaissant les limitations connues par rapport au jugement humain.

Clinical relevance

La traduction automatique fait partie des technologies d'IA les plus largement utilisées, intégrée dans les plateformes de recherche, de communication et de contenu, permettant un accès interlingue à l'information et alimentant des outils pour les traducteurs ; sa méthodologie d'évaluation a également influencé l'évaluation dans l'ensemble du traitement automatique du langage naturel (TALN).

History

La traduction automatique a débuté avec le mémorandum de Weaver de 1949 et les premiers systèmes basés sur des règles, a traversé le scepticisme suite au rapport ALPAC de 1966, puis a été transformée par les modèles statistiques d'IBM (Brown et al., 1993) et la TA statistique basée sur les expressions, et de nouveau par les modèles neuronaux séquence-à-séquence et basés sur l'attention à partir du milieu des années 2010. BLEU (2002) a standardisé l'évaluation de manière générale.

Key figures

Peter F. Brown
Robert L. Mercer
Philipp Koehn
Kishore Papineni
Warren Weaver

Seminal works

brown1993
papineni2002
koehn2010

Frequently asked questions

Que mesure le score BLEU ?: BLEU mesure le degré de chevauchement d'une traduction automatique, en termes de séquences de mots correspondantes (n-grammes), avec une ou plusieurs traductions de référence humaines, avec une pénalité pour les traductions trop courtes. Il corrèle raisonnablement avec les jugements humains et permet une comparaison automatique rapide, bien qu'il ne saisisse pas entièrement le sens ou la fluidité.
Pourquoi la traduction automatique est-elle considérée comme difficile ?: Les langues diffèrent par leur vocabulaire, l'ordre des mots, leur morphologie et les distinctions qu'elles exigent, et les mots et phrases individuels sont souvent ambigus. Produire une traduction à la fois fidèle au sens de la source et naturelle dans la langue cible nécessite de résoudre ces problèmes simultanément, ce qui est difficile.