ScholarGate
Asistan

Makine Çevirisi

Makine çevirisi, metin veya konuşmanın bir doğal dilden diğerine otomatik olarak dönüştürülmesidir ve doğal dil işlemenin en eski ve en önde gelen uygulamalarından biridir.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Makine çevirisi, kaynak dildeki bir cümle için hedef dilde eşdeğer bir cümle üretme görevidir; bu görevde kural tabanlı, istatistiksel veya nöral sistemler kullanılabilmekte ve yeterlilik ile akıcılık açısından değerlendirilmektedir.

Kapsam

Bu konu, otomatik çeviri yaklaşımlarını kapsamaktadır: kural tabanlı ve interlingua sistemleri, hizalama modelleri ve dil modelleri ile kelime ve ifade tabanlı istatistiksel makine çevirisi ve nöral dizi-dizi (sequence-to-sequence) paradigması; kelime hizalama, akıcılık ve yeterlilik arasındaki denge ile BLEU gibi metriklerle otomatik değerlendirme gibi merkezi sorunların yanı sıra. Çevirinin neden zor olduğu (belirsizlik, diller arası farklılıklar, kelime sırası) ve kalitenin nasıl ölçüldüğü konularına değinilmektedir. Genel yapay sinir ağı eğitim yöntemleri, makine öğrenimi alt alanına aittir.

Temel sorular

  • Diller arasındaki sözcüksel belirsizlik ve yapısal farklılıklar göz önüne alındığında, çeviriyi zorlaştıran nedir?
  • Kelime ve ifade karşılıkları (hizalamalar) paralel metinlerden nasıl öğrenilir?
  • İstatistiksel ve nöral çeviri modelleri yeterlilik ve akıcılık arasında nasıl bir denge kurar?
  • Çeviri kalitesi otomatik ve güvenilir bir şekilde nasıl ölçülür?

Anahtar kavramlar

  • kaynak ve hedef dil
  • paralel derlemler
  • kelime ve ifade hizalama
  • çeviri modeli ve dil modeli
  • istatistiksel makine çevirisi
  • nöral dizi-dizi çevirisi
  • yeterlilik ve akıcılık
  • BLEU ve otomatik değerlendirme

Temel kuramlar

İstatistiksel makine çevirisi
İstatistiksel makine çevirisi, çeviriyi, kaynak cümle verildiğinde olasılığı maksimize eden hedef cümleyi bulma olarak modeller; bu, paralel derlemlerdeki kelime/ifade hizalamalarından öğrenilen bir çeviri modeli ve akıcılık için bir hedef dil modeli aracılığıyla ayrıştırılır.
Kelime hizalama
Paralel metinden hangi kaynak kelimelerin hangi hedef kelimelere karşılık geldiğini öğrenmek (IBM hizalama modelleri), iki dili birbirine bağlayan ve ifade çıkarımını destekleyen temel bir bileşendir.
Otomatik değerlendirme
BLEU gibi metrikler, sistem çıktısını insan referans çevirileriyle n-gram örtüşmesi yoluyla karşılaştırır; bu, ilerlemeyi sağlayan hızlı, tekrarlanabilir değerlendirmeyi mümkün kılarken, insan yargısına göre bilinen sınırlamalarını da kabul etmektedir.

Klinik önem

Makine çevirisi, en yaygın kullanılan yapay zeka teknolojileri arasındadır; arama, iletişim ve içerik platformlarına entegre edilmiştir, bilgiye diller arası erişimi sağlamakta ve çevirmenler için araçları güçlendirmektedir; değerlendirme metodolojisi, doğal dil işleme (NLP) genelindeki değerlendirmeleri de etkilemiştir.

Tarihçe

Makine çevirisi, Weaver'ın 1949 tarihli memorandumu ve erken kural tabanlı sistemlerle başlamıştır, 1966 ALPAC raporunu takip eden şüpheciliğe dayanmıştır, ardından IBM'in istatistiksel modelleri (Brown ve ark., 1993) ve ifade tabanlı İstatistiksel Makine Çevirisi (SMT) ile dönüşüme uğramıştır ve 2010'ların ortalarından itibaren nöral dizi-dizi (sequence-to-sequence) ve dikkat tabanlı modellerle tekrar dönüşmüştür. BLEU (2002) ise değerlendirmeyi baştan sona standartlaştırmıştır.

Öne çıkan isimler

  • Peter F. Brown
  • Robert L. Mercer
  • Philipp Koehn
  • Kishore Papineni
  • Warren Weaver

İlgili konular

Temel eserler

  • brown1993
  • papineni2002
  • koehn2010

Sıkça sorulan sorular

BLEU puanı neyi ölçer?
BLEU, bir makine çevirisinin bir veya daha fazla insan referans çevirisiyle eşleşen kelime dizileri (n-gramlar) açısından ne kadar örtüştüğünü ölçer ve çok kısa olması durumunda bir ceza uygular. İnsan yargılarıyla makul ölçüde ilişkilidir ve hızlı otomatik karşılaştırmaya olanak tanır, ancak anlamı veya akıcılığı tam olarak yakalamamaktadır.
Makine çevirisi neden zor kabul edilir?
Diller kelime dağarcığı, kelime sırası, morfoloji ve gerektirdikleri ayrımlar açısından farklılık gösterir ve tek tek kelimeler ile cümleler genellikle belirsizdir. Hem kaynak anlama sadık hem de hedef dilde doğal olan bir çeviri üretmek, bu sorunları eş zamanlı olarak çözmeyi gerektirir ki bu da zordur.

Bu kavram için yöntemler

İlgili kavramlar