Automatische Textbewertung — BLEU, ROUGE, BERTScore
Die automatische Textbewertung ist eine Familie von referenzbasierten Metriken, die verwendet werden, um die Qualität von maschinell generiertem Text – wie Übersetzungen, Zusammenfassungen oder Natural-Language-Generation (NLG)-Ausgaben – zu messen, indem sie mit einem oder mehreren von Menschen verfassten Referenztexten verglichen werden. Von Papineni et al. mit BLEU im Jahr 2002 eingeführt, hat sich das Feld um N-Gramm-Overlap-Metriken (BLEU, ROUGE) und semantisch bewusste Metriken (BERTScore, MoverScore) erweitert, die die Bedeutung über oberflächliche Wortübereinstimmungen hinaus erfassen.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
Quellen
- Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
- Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/de/text-mining/automatic-text-evaluation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-EinbettungenText Mining↔ compare
- Sentiment-AnalyseText Mining↔ compare
- TextklassifizierungText Mining↔ compare
- ThemenmodellierungDeep Learning↔ compare
Referenziert von
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →