ScholarGate
Asistan

Makine Çevirisi

Metni bir dilden diğerine otomatik olarak çevirme alanı olup, kelime hizalama modelleri aracılığıyla istatistiksel doğal dil işlemeyi (NLP) yönlendirmiş ve günümüzde sinirsel dizi-diziden çeviriye dayanmaktadır.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Makine çevirisi, metin veya konuşmanın bir kaynak dilden hedef dildeki eşdeğer bir ifadeye otomatik olarak dönüştürülmesidir.

Kapsam

Diller arası otomatik çeviriyi kapsar: kelime ve öbek tabanlı istatistiksel modeller, hizalama ve gürültülü kanal çerçevesi, dikkat mekanizmalı ve transformatörlü sinirsel makine çevirisi ve çeviri kalitesinin değerlendirilmesi. Düşük kaynaklı ve çok dilli çeviri konularını ele almaktadır. Genel transformatör mimarisi, ilgili başka bir konuda incelenmektedir.

Temel sorular

  • Gürültülü kanal modeli, çeviriyi bir arama problemi olarak nasıl çerçeveler?
  • Kelime ve öbek hizalamaları paralel korpuslardan nasıl öğrenilir?
  • Sinirsel makine çevirisi, öbek tabanlı sistemleri nasıl geride bırakmıştır?
  • Çeviri kalitesi otomatik olarak ve insanlar tarafından nasıl ölçülür?

Anahtar kavramlar

  • paralel korpus
  • kelime hizalama
  • öbek tabanlı çeviri
  • gürültülü kanal modeli
  • sinirsel makine çevirisi
  • alt kelime birimleri
  • BLEU
  • düşük kaynaklı çeviri

Temel kuramlar

İstatistiksel kelime hizalama modelleri
Brown ve meslektaşlarının, paralel metinlerden kelime karşılıklarını öğrenen ve çeviriyi olasılıksal olarak çerçeveleyen, istatistiksel makine çevirisinin temelini oluşturan IBM modelleri.
Sinirsel makine çevirisi
Nadir kelimeleri işlemek için alt kelime birimlerini kullanarak, açık hizalama veya öbek tabloları olmaksızın çeviri yapan, dikkat mekanizmalı uçtan uca kodlayıcı-kod çözücü modelleri.

Tarihçe

Erken kural tabanlı sistemlerin hayal kırıklıklarından sonra, Brown ve meslektaşlarının 1993 tarihli IBM modelleri istatistiksel makine çevirisini başlatmış, bu modeller Koehn tarafından belgelenen öbek tabanlı sistemlere dönüştürülerek geliştirilmiştir. Sinirsel makine çevirisi 2014-2016 yılları civarında ortaya çıkmış, hızla standart haline gelmiş ve yaygın olarak kullanılan çeviri hizmetlerine güç vermiştir.

Tartışmalar

Otomatik değerlendirmenin yeterliliği
BLEU gibi metrikler hızlı ilerlemeyi sağlamış olsa da, insan akıcılık ve yeterlilik değerlendirmeleriyle tam olarak örtüşmemektedir, bu da yüksek riskli değerlendirmeler için insan değerlendirmesini vazgeçilmez kılmaktadır.

Öne çıkan isimler

  • Peter Brown
  • Robert Mercer
  • Philipp Koehn
  • Rico Sennrich

İlgili konular

Temel eserler

  • brown1993
  • papineni2002
  • sennrich2016

Sıkça sorulan sorular

Makine çevirisi, NLP'nin tarihinde neden bu kadar önemli olmuştur?
Çeviri, net hedefler, bol miktarda paralel veri ve istatistiksel ve ardından sinirsel yöntemleri ödüllendiren zorlu bir problem sunmuştur; bu nedenle makine çevirisindeki (MT) ilerlemeler, daha geniş alandaki gelişmeleri defalarca tetiklemiştir.

Bu kavram için yöntemler

İlgili kavramlar