ScholarGate
Asisten

Terjemahan Mesin

Menerjemahkan teks secara otomatis dari satu bahasa ke bahasa lain, bidang yang mendorong NLP statistik melalui model penyelarasan kata dan sekarang mengandalkan terjemahan sekuens-ke-sekuens saraf.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Terjemahan mesin adalah konversi otomatis teks atau ucapan dari bahasa sumber ke dalam ekspresi yang setara dalam bahasa target.

Scope

Mencakup terjemahan otomatis antar bahasa: model statistik berbasis kata dan frasa, penyelarasan dan kerangka saluran bising, terjemahan mesin saraf dengan perhatian dan transformer, serta evaluasi kualitas terjemahan. Ini membahas terjemahan sumber daya rendah dan multibahasa. Arsitektur transformer umum dibahas dalam topik terkait.

Core questions

  • Bagaimana model saluran bising membingkai terjemahan sebagai masalah pencarian?
  • Bagaimana penyelarasan kata dan frasa dipelajari dari korpus paralel?
  • Bagaimana terjemahan mesin saraf melampaui sistem berbasis frasa?
  • Bagaimana kualitas terjemahan diukur secara otomatis dan oleh manusia?

Key concepts

  • korpus paralel
  • penyelarasan kata
  • terjemahan berbasis frasa
  • model saluran bising
  • terjemahan mesin saraf
  • unit subkata
  • BLEU
  • terjemahan sumber daya rendah

Key theories

Model penyelarasan kata statistik
Model IBM oleh Brown dan rekan-rekannya yang mempelajari korespondensi kata dari teks paralel dan membingkai terjemahan secara probabilistik, mendasari terjemahan mesin statistik.
Terjemahan mesin saraf
Model encoder-decoder ujung-ke-ujung dengan perhatian yang menerjemahkan tanpa penyelarasan eksplisit atau tabel frasa, menggunakan unit subkata untuk menangani kata-kata langka.

History

Setelah kekecewaan sistem berbasis aturan awal, model IBM tahun 1993 oleh Brown dan rekan-rekannya meluncurkan terjemahan mesin statistik, yang disempurnakan menjadi sistem berbasis frasa yang didokumentasikan oleh Koehn. Terjemahan mesin saraf muncul sekitar tahun 2014–2016, dengan cepat menjadi standar dan menggerakkan layanan terjemahan yang banyak digunakan.

Debates

Kecukupan evaluasi otomatis
Metrik seperti BLEU memungkinkan kemajuan pesat tetapi berkorelasi tidak sempurna dengan penilaian manusia tentang kefasihan dan kecukupan, menjaga evaluasi manusia tetap penting untuk penilaian berisiko tinggi.

Key figures

  • Peter Brown
  • Robert Mercer
  • Philipp Koehn
  • Rico Sennrich

Related topics

Seminal works

  • brown1993
  • papineni2002
  • sennrich2016

Frequently asked questions

Mengapa terjemahan mesin begitu penting bagi sejarah NLP?
Terjemahan menyediakan tujuan yang jelas, data paralel yang melimpah, dan masalah sulit yang menghargai metode statistik dan kemudian saraf, sehingga kemajuan dalam MT berulang kali mendorong kemajuan di seluruh bidang yang lebih luas.

Methods for this concept

Related concepts