Traducción automática
Traducción automática de texto de un idioma a otro, el campo que impulsó el PLN estadístico a través de modelos de alineación de palabras y que ahora se basa en la traducción neuronal secuencia a secuencia.
Definition
La traducción automática es la conversión automática de texto o voz de un idioma de origen a una expresión equivalente en un idioma de destino.
Scope
Cubre la traducción automática entre idiomas: modelos estadísticos basados en palabras y frases, alineación y el marco de canal ruidoso, traducción automática neuronal con atención y transformadores, y la evaluación de la calidad de la traducción. Aborda la traducción multilingüe y de bajos recursos. La arquitectura general del transformador se cubre en un tema relacionado.
Core questions
- ¿Cómo enmarca el modelo de canal ruidoso la traducción como un problema de búsqueda?
- ¿Cómo se aprenden las alineaciones de palabras y frases a partir de corpus paralelos?
- ¿Cómo superó la traducción automática neuronal a los sistemas basados en frases?
- ¿Cómo se mide la calidad de la traducción de forma automática y por humanos?
Key concepts
- corpus paralelo
- alineación de palabras
- traducción basada en frases
- modelo de canal ruidoso
- traducción automática neuronal
- unidades de subpalabra
- BLEU
- traducción de bajos recursos
Key theories
- Modelos estadísticos de alineación de palabras
- Los modelos IBM de Brown y sus colegas que aprenden correspondencias de palabras a partir de texto paralelo y enmarcan la traducción probabilísticamente, fundando la traducción automática estadística.
- Traducción automática neuronal
- Modelos codificador-decodificador de extremo a extremo con atención que traducen sin alineación explícita o tablas de frases, utilizando unidades de subpalabra para manejar palabras raras.
History
Después de las decepciones de los primeros sistemas basados en reglas, los modelos IBM de Brown y sus colegas de 1993 lanzaron la traducción automática estadística, refinada en sistemas basados en frases documentados por Koehn. La traducción automática neuronal surgió alrededor de 2014-2016, convirtiéndose rápidamente en el estándar e impulsando servicios de traducción ampliamente utilizados.
Debates
- Adecuación de la evaluación automática
- Métricas como BLEU permitieron un rápido progreso, pero se correlacionan imperfectamente con los juicios humanos de fluidez y adecuación, manteniendo la evaluación humana esencial para la evaluación de alto riesgo.
Key figures
- Peter Brown
- Robert Mercer
- Philipp Koehn
- Rico Sennrich
Related topics
Seminal works
- brown1993
- papineni2002
- sennrich2016
Frequently asked questions
- ¿Por qué fue tan importante la traducción automática para la historia del PLN?
- La traducción proporcionó objetivos claros, abundantes datos paralelos y un problema difícil que recompensó los métodos estadísticos y luego neuronales, por lo que los avances en la TA impulsaron repetidamente el progreso en todo el campo.