Process / pipeline

การประเมินข้อความอัตโนมัติ — BLEU, ROUGE, BERTScore

การประเมินข้อความอัตโนมัติ (Automatic text evaluation) เป็นกลุ่มของเมตริกที่อ้างอิงจากข้อความต้นฉบับ ใช้สำหรับวัดคุณภาพของข้อความที่สร้างโดยเครื่องจักร เช่น งานแปล บทสรุป หรือผลลัพธ์จากการสร้างภาษาธรรมชาติ (NLG) โดยการเปรียบเทียบกับข้อความอ้างอิงที่เขียนโดยมนุษย์หนึ่งชุดหรือมากกว่านั้น Papineni และคณะ เป็นผู้บุกเบิกด้วยเมตริก BLEU ในปี 2002 ซึ่งทำให้สาขาวิชานี้เติบโตขึ้นจนครอบคลุมเมตริกการทับซ้อนของ n-gram (BLEU, ROUGE) และเมตริกที่คำนึงถึงความหมาย (BERTScore, MoverScore) ซึ่งสามารถจับความหมายที่นอกเหนือจากการจับคู่คำบนพื้นผิวได้

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

การประเมินข้อความอัตโนมัติ

BERT Embeddings การวิเคราะห์ความรู้สึก การจำแนกข้อความ การสร้างแบบจำลองหัวข้อ (…การสร้างภาษาธรรมชาติ การให้คะแนนความเชื่อมโยง…

แหล่งอ้างอิง

Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/th/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT Embeddingsการทำเหมืองข้อความ↔ compare
การวิเคราะห์ความรู้สึกการทำเหมืองข้อความ↔ compare
การจำแนกข้อความการทำเหมืองข้อความ↔ compare
การสร้างแบบจำลองหัวข้อ (Topic Modeling)การเรียนรู้เชิงลึก↔ compare

Compare side by side →

ถูกอ้างอิงโดย

การสร้างภาษาธรรมชาติ การให้คะแนนความเชื่อมโยงของข้อความ

พบปัญหาในหน้านี้หรือไม่ แจ้งหรือเสนอการแก้ไข →