การประเมินข้อความอัตโนมัติ — BLEU, ROUGE, BERTScore
การประเมินข้อความอัตโนมัติ (Automatic text evaluation) เป็นกลุ่มของเมตริกที่อ้างอิงจากข้อความต้นฉบับ ใช้สำหรับวัดคุณภาพของข้อความที่สร้างโดยเครื่องจักร เช่น งานแปล บทสรุป หรือผลลัพธ์จากการสร้างภาษาธรรมชาติ (NLG) โดยการเปรียบเทียบกับข้อความอ้างอิงที่เขียนโดยมนุษย์หนึ่งชุดหรือมากกว่านั้น Papineni และคณะ เป็นผู้บุกเบิกด้วยเมตริก BLEU ในปี 2002 ซึ่งทำให้สาขาวิชานี้เติบโตขึ้นจนครอบคลุมเมตริกการทับซ้อนของ n-gram (BLEU, ROUGE) และเมตริกที่คำนึงถึงความหมาย (BERTScore, MoverScore) ซึ่งสามารถจับความหมายที่นอกเหนือจากการจับคู่คำบนพื้นผิวได้
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
แหล่งอ้างอิง
- Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
- Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/th/text-mining/automatic-text-evaluation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT Embeddingsการทำเหมืองข้อความ↔ compare
- การวิเคราะห์ความรู้สึกการทำเหมืองข้อความ↔ compare
- การจำแนกข้อความการทำเหมืองข้อความ↔ compare
- การสร้างแบบจำลองหัวข้อ (Topic Modeling)การเรียนรู้เชิงลึก↔ compare