ScholarGate
עוזר
Process / pipeline

הערכת טקסט אוטומטית — BLEU, ROUGE, BERTScore

הערכת טקסט אוטומטית היא משפחה של מדדים מבוססי-הפניה, המשמשים למדידת איכות הטקסט שנוצר על ידי מכונה — כגון תרגומים, סיכומים, או פלטי יצירת שפה טבעית (NLG) — על ידי השוואתם לטקסט אחד או יותר שנכתבו על ידי אדם. התחום, שקודם על ידי פפניני ועמיתיו עם BLEU בשנת 2002, גדל לכלול מדדי חפיפה של n-gram (BLEU, ROUGE) ומדדים מודעי-סמנטיקה (BERTScore, MoverScore) הלוכדים משמעות מחוץ להתאמות מילים שטחיות.

פתיחה ב-MethodMindבקרובוידאובקרובDownload slides

קראו את השיטה במלואה

לחברים בלבד

התחברו עם חשבון חינמי כדי לקרוא חלק זה.

התחברות

Method map

The neighbourhood of related methods — select a node to explore.

מקורות

  1. Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link
  2. Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link

איך לצטט עמוד זה

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/he/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

מאוזכר על ידי

ScholarGateAutomatic Text Evaluation (Automatic Text Evaluation (BLEU, ROUGE, BERTScore)). אוחזר בתאריך 2026-06-15 מתוך https://scholargate.app/he/text-mining/automatic-text-evaluation · מערך נתונים: https://doi.org/10.5281/zenodo.20539026