ScholarGate
Asisten
Process / pipeline

Evaluasi Teks Otomatis — BLEU, ROUGE, BERTScore

Evaluasi teks otomatis adalah keluarga metrik berbasis referensi yang digunakan untuk mengukur kualitas teks yang dihasilkan mesin — seperti terjemahan, ringkasan, atau keluaran generasi bahasa alami (NLG) — dengan membandingkannya dengan satu atau lebih teks referensi yang ditulis manusia. Dipelopori oleh Papineni et al. dengan BLEU pada tahun 2002, bidang ini telah berkembang untuk mencakup metrik tumpang tindih n-gram (BLEU, ROUGE) dan metrik yang sadar semantik (BERTScore, MoverScore) yang menangkap makna di luar kecocokan kata permukaan.

Buka di MethodMindSegeraVideoSegeraDownload slides

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Method map

The neighbourhood of related methods — select a node to explore.

Sumber

  1. Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link
  2. Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link

Cara menyitasi halaman ini

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/id/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Dirujuk oleh

ScholarGateAutomatic Text Evaluation (Automatic Text Evaluation (BLEU, ROUGE, BERTScore)). Diakses 2026-06-15 dari https://scholargate.app/id/text-mining/automatic-text-evaluation · Set data: https://doi.org/10.5281/zenodo.20539026