Penilaian Teks Automatik — BLEU, ROUGE, BERTScore
Penilaian teks automatik ialah satu keluarga metrik berasaskan rujukan yang digunakan untuk mengukur kualiti teks yang dijana oleh mesin — seperti terjemahan, ringkasan, atau output penjanaan bahasa semula jadi (NLG) — dengan membandingkannya dengan satu atau lebih teks rujukan yang ditulis oleh manusia. Dipelopori oleh Papineni et al. dengan BLEU pada tahun 2002, bidang ini telah berkembang untuk merangkumi metrik pertindihan n-gram (BLEU, ROUGE) dan metrik yang peka terhadap semantik (BERTScore, MoverScore) yang menangkap makna di luar padanan perkataan permukaan.
Baca kaedah sepenuhnya
Log masuk dengan akaun percuma untuk membaca bahagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
Sumber
- Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
- Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗
Cara memetik halaman ini
ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/ms/text-mining/automatic-text-evaluation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Sematik BERTPerlombongan Teks↔ compare
- Analisis SentimenPerlombongan Teks↔ compare
- Klasifikasi TeksPerlombongan Teks↔ compare
- Pemodelan TopikPembelajaran Mendalam↔ compare
Dirujuk oleh
Terjumpa masalah pada halaman ini? Laporkan atau cadangkan pembetulan →