Evaluasi Teks Otomatis — BLEU, ROUGE, BERTScore
Evaluasi teks otomatis adalah keluarga metrik berbasis referensi yang digunakan untuk mengukur kualitas teks yang dihasilkan mesin — seperti terjemahan, ringkasan, atau keluaran generasi bahasa alami (NLG) — dengan membandingkannya dengan satu atau lebih teks referensi yang ditulis manusia. Dipelopori oleh Papineni et al. dengan BLEU pada tahun 2002, bidang ini telah berkembang untuk mencakup metrik tumpang tindih n-gram (BLEU, ROUGE) dan metrik yang sadar semantik (BERTScore, MoverScore) yang menangkap makna di luar kecocokan kata permukaan.
Baca metode selengkapnya
Masuk dengan akun gratis untuk membaca bagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
Sumber
- Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
- Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗
Cara menyitasi halaman ini
ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/id/text-mining/automatic-text-evaluation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Embedding BERTPenambangan Teks↔ compare
- Analisis SentimenPenambangan Teks↔ compare
- Klasifikasi TeksPenambangan Teks↔ compare
- Pemodelan TopikPembelajaran Mendalam↔ compare
Dirujuk oleh
Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →