¿Qué mide la puntuación BLEU?

BLEU mide cuánto se superpone una traducción automática, en términos de secuencias de palabras coincidentes (n-gramas), con una o más traducciones de referencia humanas, con una penalización por ser demasiado corta. Se correlaciona razonablemente con los juicios humanos y permite una comparación automática rápida, aunque no captura completamente el significado o la fluidez.

¿Por qué se considera difícil la traducción automática?

Los idiomas difieren en vocabulario, orden de las palabras, morfología y las distinciones que requieren, y las palabras y oraciones individuales a menudo son ambiguas. Producir una traducción que sea fiel al significado original y natural en el idioma de destino requiere resolver estos problemas simultáneamente, lo cual es difícil.

Traducción automática

La traducción automática es la conversión automática de texto o voz de un lenguaje natural a otro, una de las aplicaciones más antiguas y destacadas del procesamiento del lenguaje natural.

Encontrar tema con PaperMindPróximamenteFind papers & topics

Tools & resources

Descargar diapositivas

Learn & explore

VídeoPróximamente

Definition

La traducción automática es la tarea de producir, para una oración en un idioma de origen, una oración equivalente en un idioma de destino, utilizando sistemas que pueden ser basados en reglas, estadísticos o neuronales, y evaluados por su adecuación y fluidez.

Scope

Este tema abarca los enfoques de la traducción automática: sistemas basados en reglas e interlingua, traducción automática estadística basada en palabras y frases con modelos de alineación y modelos de lenguaje, y el paradigma neuronal de secuencia a secuencia; junto con los problemas centrales de la alineación de palabras, la fluidez frente a la adecuación, y la evaluación automática con métricas como BLEU. Aborda por qué la traducción es difícil (ambigüedad, divergencia entre idiomas, orden de las palabras) y cómo se mide la calidad. Los métodos generales de entrenamiento de redes neuronales pertenecen al subcampo del aprendizaje automático.

Core questions

¿Qué dificulta la traducción, dada la ambigüedad léxica y la divergencia estructural entre idiomas?
¿Cómo se aprenden las correspondencias de palabras y frases (alineaciones) a partir de texto paralelo?
¿Cómo equilibran los modelos de traducción estadísticos y neuronales la adecuación y la fluidez?
¿Cómo se mide la calidad de la traducción de forma automática y fiable?

Key concepts

idioma de origen y de destino
corpus paralelo
alineación de palabras y frases
modelo de traducción y modelo de lenguaje
traducción automática estadística
traducción neuronal de secuencia a secuencia
adecuación y fluidez
BLEU y evaluación automática

Key theories

Traducción automática estadística: La MT estadística modela la traducción como la búsqueda de la oración objetivo que maximiza la probabilidad dada la fuente, descompuesta a través de un modelo de traducción aprendido de alineaciones de palabras/frases en corpus paralelos y un modelo de lenguaje objetivo para la fluidez.
Alineación de palabras: Aprender qué palabras de origen corresponden a qué palabras de destino a partir de texto paralelo (los modelos de alineación de IBM) es un componente fundamental que conecta los dos idiomas y apoya la extracción de frases.
Evaluación automática: Métricas como BLEU comparan la salida del sistema con las traducciones de referencia humanas mediante la superposición de n-gramas, lo que permite una evaluación rápida y repetible que impulsó el progreso, al tiempo que reconoce las limitaciones conocidas en relación con el juicio humano.

Clinical relevance

La traducción automática se encuentra entre las tecnologías de IA más utilizadas, integrada en plataformas de búsqueda, comunicación y contenido, lo que permite el acceso multilingüe a la información e impulsa herramientas para traductores; su metodología de evaluación también influyó en la evaluación en todo el PNL.

History

La traducción automática comenzó con el memorándum de Weaver de 1949 y los primeros sistemas basados en reglas, superó el escepticismo tras el informe ALPAC de 1966, luego fue transformada por los modelos estadísticos de IBM (Brown et al., 1993) y la SMT basada en frases, y nuevamente por los modelos neuronales de secuencia a secuencia y basados en atención a partir de mediados de la década de 2010. BLEU (2002) estandarizó la evaluación en todo el proceso.

Key figures

Peter F. Brown
Robert L. Mercer
Philipp Koehn
Kishore Papineni
Warren Weaver

Seminal works

brown1993
papineni2002
koehn2010

Frequently asked questions

¿Qué mide la puntuación BLEU?: BLEU mide cuánto se superpone una traducción automática, en términos de secuencias de palabras coincidentes (n-gramas), con una o más traducciones de referencia humanas, con una penalización por ser demasiado corta. Se correlaciona razonablemente con los juicios humanos y permite una comparación automática rápida, aunque no captura completamente el significado o la fluidez.
¿Por qué se considera difícil la traducción automática?: Los idiomas difieren en vocabulario, orden de las palabras, morfología y las distinciones que requieren, y las palabras y oraciones individuales a menudo son ambiguas. Producir una traducción que sea fiel al significado original y natural en el idioma de destino requiere resolver estos problemas simultáneamente, lo cual es difícil.