Đánh giá văn bản tự động — BLEU, ROUGE, BERTScore
Đánh giá văn bản tự động là một họ các chỉ số dựa trên tham chiếu được sử dụng để đo lường chất lượng văn bản do máy tạo ra — chẳng hạn như bản dịch, bản tóm tắt hoặc đầu ra tạo sinh ngôn ngữ tự nhiên (NLG) — bằng cách so sánh chúng với một hoặc nhiều văn bản tham chiếu do con người viết. Được tiên phong bởi Papineni và cộng sự với BLEU vào năm 2002, lĩnh vực này đã phát triển bao gồm các chỉ số chồng lấn n-gram (BLEU, ROUGE) và các chỉ số nhận biết ngữ nghĩa (BERTScore, MoverScore) nắm bắt ý nghĩa vượt ra ngoài các từ ngữ bề mặt.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
- Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/vi/text-mining/automatic-text-evaluation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT EmbeddingsKhai phá văn bản↔ compare
- Phân tích Cảm xúcKhai phá văn bản↔ compare
- Phân loại văn bảnKhai phá văn bản↔ compare
- Topic Modeling (Mô hình hóa chủ đề)Học sâu↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →