ScholarGate
Assistent
Process / pipeline

Automatische Textbewertung — BLEU, ROUGE, BERTScore

Die automatische Textbewertung ist eine Familie von referenzbasierten Metriken, die verwendet werden, um die Qualität von maschinell generiertem Text – wie Übersetzungen, Zusammenfassungen oder Natural-Language-Generation (NLG)-Ausgaben – zu messen, indem sie mit einem oder mehreren von Menschen verfassten Referenztexten verglichen werden. Von Papineni et al. mit BLEU im Jahr 2002 eingeführt, hat sich das Feld um N-Gramm-Overlap-Metriken (BLEU, ROUGE) und semantisch bewusste Metriken (BERTScore, MoverScore) erweitert, die die Bedeutung über oberflächliche Wortübereinstimmungen hinaus erfassen.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Quellen

  1. Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link
  2. Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link

So zitieren Sie diese Seite

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/de/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referenziert von

ScholarGateAutomatic Text Evaluation (Automatic Text Evaluation (BLEU, ROUGE, BERTScore)). Abgerufen am 2026-06-15 von https://scholargate.app/de/text-mining/automatic-text-evaluation · Datensatz: https://doi.org/10.5281/zenodo.20539026