ScholarGate
Assistent
Process / pipeline

Avaluació automàtica de text — BLEU, ROUGE, BERTScore

L'avaluació automàtica de text és una família de mètriques basades en referències que s'utilitzen per mesurar la qualitat del text generat per màquines —com ara traduccions, resums o sortides de generació de llenguatge natural (NLG)— comparant-los amb un o més textos de referència escrits per humans. Iniciat per Papineni et al. amb BLEU el 2002, el camp ha crescut fins a incloure mètriques de superposició d'n-grames (BLEU, ROUGE) i mètriques semànticament conscients (BERTScore, MoverScore) que capturen el significat més enllà de les coincidències superficials de paraules.

Obre a MethodMindAviatVídeoAviatDownload slides

Llegeix el mètode complet

Només per a membres

Inicia la sessió amb un compte gratuït per llegir aquesta secció.

Inicia la sessió

Method map

The neighbourhood of related methods — select a node to explore.

Fonts

  1. Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link
  2. Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link

Com citar aquesta pàgina

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/ca/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citat per

ScholarGateAutomatic Text Evaluation (Automatic Text Evaluation (BLEU, ROUGE, BERTScore)). Recuperat el 2026-06-15 de https://scholargate.app/ca/text-mining/automatic-text-evaluation · Conjunt de dades: https://doi.org/10.5281/zenodo.20539026