Terjemahan Mesin
Menerjemahkan teks secara otomatis dari satu bahasa ke bahasa lain, bidang yang mendorong NLP statistik melalui model penyelarasan kata dan sekarang mengandalkan terjemahan sekuens-ke-sekuens saraf.
Definition
Terjemahan mesin adalah konversi otomatis teks atau ucapan dari bahasa sumber ke dalam ekspresi yang setara dalam bahasa target.
Scope
Mencakup terjemahan otomatis antar bahasa: model statistik berbasis kata dan frasa, penyelarasan dan kerangka saluran bising, terjemahan mesin saraf dengan perhatian dan transformer, serta evaluasi kualitas terjemahan. Ini membahas terjemahan sumber daya rendah dan multibahasa. Arsitektur transformer umum dibahas dalam topik terkait.
Core questions
- Bagaimana model saluran bising membingkai terjemahan sebagai masalah pencarian?
- Bagaimana penyelarasan kata dan frasa dipelajari dari korpus paralel?
- Bagaimana terjemahan mesin saraf melampaui sistem berbasis frasa?
- Bagaimana kualitas terjemahan diukur secara otomatis dan oleh manusia?
Key concepts
- korpus paralel
- penyelarasan kata
- terjemahan berbasis frasa
- model saluran bising
- terjemahan mesin saraf
- unit subkata
- BLEU
- terjemahan sumber daya rendah
Key theories
- Model penyelarasan kata statistik
- Model IBM oleh Brown dan rekan-rekannya yang mempelajari korespondensi kata dari teks paralel dan membingkai terjemahan secara probabilistik, mendasari terjemahan mesin statistik.
- Terjemahan mesin saraf
- Model encoder-decoder ujung-ke-ujung dengan perhatian yang menerjemahkan tanpa penyelarasan eksplisit atau tabel frasa, menggunakan unit subkata untuk menangani kata-kata langka.
History
Setelah kekecewaan sistem berbasis aturan awal, model IBM tahun 1993 oleh Brown dan rekan-rekannya meluncurkan terjemahan mesin statistik, yang disempurnakan menjadi sistem berbasis frasa yang didokumentasikan oleh Koehn. Terjemahan mesin saraf muncul sekitar tahun 2014–2016, dengan cepat menjadi standar dan menggerakkan layanan terjemahan yang banyak digunakan.
Debates
- Kecukupan evaluasi otomatis
- Metrik seperti BLEU memungkinkan kemajuan pesat tetapi berkorelasi tidak sempurna dengan penilaian manusia tentang kefasihan dan kecukupan, menjaga evaluasi manusia tetap penting untuk penilaian berisiko tinggi.
Key figures
- Peter Brown
- Robert Mercer
- Philipp Koehn
- Rico Sennrich
Related topics
Seminal works
- brown1993
- papineni2002
- sennrich2016
Frequently asked questions
- Mengapa terjemahan mesin begitu penting bagi sejarah NLP?
- Terjemahan menyediakan tujuan yang jelas, data paralel yang melimpah, dan masalah sulit yang menghargai metode statistik dan kemudian saraf, sehingga kemajuan dalam MT berulang kali mendorong kemajuan di seluruh bidang yang lebih luas.