Mengapa terjemahan mesin begitu penting bagi sejarah NLP?

Terjemahan menyediakan tujuan yang jelas, data paralel yang melimpah, dan masalah sulit yang menghargai metode statistik dan kemudian saraf, sehingga kemajuan dalam MT berulang kali mendorong kemajuan di seluruh bidang yang lebih luas.

Terjemahan Mesin

Menerjemahkan teks secara otomatis dari satu bahasa ke bahasa lain, bidang yang mendorong NLP statistik melalui model penyelarasan kata dan sekarang mengandalkan terjemahan sekuens-ke-sekuens saraf.

Temukan Topik dengan PaperMindSegeraFind papers & topics

Tools & resources

Unduh salindia

Learn & explore

VideoSegera

Definition

Terjemahan mesin adalah konversi otomatis teks atau ucapan dari bahasa sumber ke dalam ekspresi yang setara dalam bahasa target.

Scope

Mencakup terjemahan otomatis antar bahasa: model statistik berbasis kata dan frasa, penyelarasan dan kerangka saluran bising, terjemahan mesin saraf dengan perhatian dan transformer, serta evaluasi kualitas terjemahan. Ini membahas terjemahan sumber daya rendah dan multibahasa. Arsitektur transformer umum dibahas dalam topik terkait.

Core questions

Bagaimana model saluran bising membingkai terjemahan sebagai masalah pencarian?
Bagaimana penyelarasan kata dan frasa dipelajari dari korpus paralel?
Bagaimana terjemahan mesin saraf melampaui sistem berbasis frasa?
Bagaimana kualitas terjemahan diukur secara otomatis dan oleh manusia?

Key concepts

korpus paralel
penyelarasan kata
terjemahan berbasis frasa
model saluran bising
terjemahan mesin saraf
unit subkata
BLEU
terjemahan sumber daya rendah

Key theories

Model penyelarasan kata statistik: Model IBM oleh Brown dan rekan-rekannya yang mempelajari korespondensi kata dari teks paralel dan membingkai terjemahan secara probabilistik, mendasari terjemahan mesin statistik.
Terjemahan mesin saraf: Model encoder-decoder ujung-ke-ujung dengan perhatian yang menerjemahkan tanpa penyelarasan eksplisit atau tabel frasa, menggunakan unit subkata untuk menangani kata-kata langka.

History

Setelah kekecewaan sistem berbasis aturan awal, model IBM tahun 1993 oleh Brown dan rekan-rekannya meluncurkan terjemahan mesin statistik, yang disempurnakan menjadi sistem berbasis frasa yang didokumentasikan oleh Koehn. Terjemahan mesin saraf muncul sekitar tahun 2014–2016, dengan cepat menjadi standar dan menggerakkan layanan terjemahan yang banyak digunakan.

Debates

Kecukupan evaluasi otomatis: Metrik seperti BLEU memungkinkan kemajuan pesat tetapi berkorelasi tidak sempurna dengan penilaian manusia tentang kefasihan dan kecukupan, menjaga evaluasi manusia tetap penting untuk penilaian berisiko tinggi.

Key figures

Peter Brown
Robert Mercer
Philipp Koehn
Rico Sennrich

Seminal works

brown1993
papineni2002
sennrich2016

Frequently asked questions

Mengapa terjemahan mesin begitu penting bagi sejarah NLP?: Terjemahan menyediakan tujuan yang jelas, data paralel yang melimpah, dan masalah sulit yang menghargai metode statistik dan kemudian saraf, sehingga kemajuan dalam MT berulang kali mendorong kemajuan di seluruh bidang yang lebih luas.