Process / pipeline

การประเมินข้อความอัตโนมัติ — BLEU, ROUGE, BERTScore

การประเมินข้อความอัตโนมัติ (Automatic text evaluation) เป็นกลุ่มของเมตริกที่อ้างอิงจากข้อความต้นฉบับ ใช้สำหรับวัดคุณภาพของข้อความที่สร้างโดยเครื่องจักร เช่น งานแปล บทสรุป หรือผลลัพธ์จากการสร้างภาษาธรรมชาติ (NLG) โดยการเปรียบเทียบกับข้อความอ้างอิงที่เขียนโดยมนุษย์หนึ่งชุดหรือมากกว่านั้น Papineni และคณะ เป็นผู้บุกเบิกด้วยเมตริก BLEU ในปี 2002 ซึ่งทำให้สาขาวิชานี้เติบโตขึ้นจนครอบคลุมเมตริกการทับซ้อนของ n-gram (BLEU, ROUGE) และเมตริกที่คำนึงถึงความหมาย (BERTScore, MoverScore) ซึ่งสามารถจับความหมายที่นอกเหนือจากการจับคู่คำบนพื้นผิวได้

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

แหล่งอ้างอิง

  1. Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link
  2. Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/th/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ถูกอ้างอิงโดย

ScholarGateAutomatic Text Evaluation (Automatic Text Evaluation (BLEU, ROUGE, BERTScore)). สืบค้นเมื่อ 2026-06-15 จาก https://scholargate.app/th/text-mining/automatic-text-evaluation · ชุดข้อมูล: https://doi.org/10.5281/zenodo.20539026