Automatyczna ewaluacja tekstu — BLEU, ROUGE, BERTScore
Automatyczna ewaluacja tekstu to rodzina metryk referencyjnych służących do pomiaru jakości tekstu generowanego maszynowo — takiego jak tłumaczenia, streszczenia czy wyniki generowania języka naturalnego (NLG) — poprzez porównanie ich z jednym lub wieloma tekstami referencyjnymi napisanymi przez człowieka. Zapoczątkowana przez Papineni et al. metryką BLEU w 2002 r., dziedzina ta rozrosła się o metryki nakładania się n-gramów (BLEU, ROUGE) oraz metryki uwzględniające znaczenie (BERTScore, MoverScore), które wychwytują sens wykraczający poza powierzchowne dopasowanie słów.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
- Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/pl/text-mining/automatic-text-evaluation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Osadzenia BERTEksploracja tekstu↔ compare
- Analiza sentymentuEksploracja tekstu↔ compare
- Klasyfikacja TekstuEksploracja tekstu↔ compare
- Modelowanie tematówUczenie głębokie↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →