기계 번역
한 언어에서 다른 언어로 텍스트를 자동으로 번역하는 것으로, 단어 정렬 모델을 통해 통계적 자연어 처리(NLP)를 이끌었으며 현재는 신경망 시퀀스-투-시퀀스 번역에 의존하는 분야입니다.
PaperMind(으)로 주제 찾기곧 제공Find papers & topics
Tools & resources
Learn & explore
동영상곧 제공
Definition
기계 번역은 원어(source language)의 텍스트나 음성을 대상 언어(target language)의 동등한 표현으로 자동 변환하는 것입니다.
Scope
언어 간 자동 번역을 다룹니다: 단어 및 구문 기반 통계 모델, 정렬 및 잡음 채널 프레임워크, 어텐션 및 트랜스포머를 이용한 신경망 기계 번역, 그리고 번역 품질 평가. 저자원 및 다국어 번역 문제도 다룹니다. 일반적인 트랜스포머 아키텍처는 관련 주제에서 다룹니다.
Core questions
- 잡음 채널 모델은 번역을 어떻게 탐색 문제로 구성하는가?
- 병렬 코퍼스에서 단어 및 구문 정렬은 어떻게 학습되는가?
- 신경망 기계 번역은 어떻게 구문 기반 시스템을 능가했는가?
- 번역 품질은 자동 및 인간 평가를 통해 어떻게 측정되는가?
Key concepts
- 병렬 코퍼스
- 단어 정렬
- 구문 기반 번역
- 잡음 채널 모델
- 신경망 기계 번역
- 하위 단어 단위
- BLEU
- 저자원 번역
Key theories
- 통계적 단어 정렬 모델
- Brown과 동료들의 IBM 모델은 병렬 텍스트에서 단어 대응 관계를 학습하고 번역을 확률적으로 구성하여 통계적 기계 번역의 기반을 마련했습니다.
- 신경망 기계 번역
- 명시적인 정렬이나 구문 테이블 없이 번역하며, 희귀 단어를 처리하기 위해 하위 단어 단위를 사용하는 어텐션 기반의 종단간 인코더-디코더 모델입니다.
History
초기 규칙 기반 시스템의 실망 이후, Brown과 동료들의 1993년 IBM 모델은 통계적 기계 번역을 시작했으며, Koehn에 의해 문서화된 구문 기반 시스템으로 발전했습니다. 신경망 기계 번역은 2014-2016년경 등장하여 빠르게 표준이 되었고 널리 사용되는 번역 서비스의 기반이 되었습니다.
Debates
- 자동 평가의 적절성
- BLEU와 같은 지표는 빠른 발전을 가능하게 했지만, 인간의 유창성 및 적절성 판단과 완벽하게 일치하지 않아 중요한 평가에서는 여전히 인간 평가가 필수적입니다.
Key figures
- Peter Brown
- Robert Mercer
- Philipp Koehn
- Rico Sennrich
Related topics
Seminal works
- brown1993
- papineni2002
- sennrich2016
Frequently asked questions
- 기계 번역이 자연어 처리(NLP) 역사에서 왜 그렇게 중요했나요?
- 번역은 명확한 목표, 풍부한 병렬 데이터, 그리고 통계적 및 신경망 방법을 보상하는 어려운 문제를 제공했기 때문에, 기계 번역의 발전은 더 넓은 분야의 발전을 반복적으로 이끌었습니다.