Process / pipeline

Automatisk tekstevaluering — BLEU, ROUGE, BERTScore

Automatisk tekstevaluering er en familie af referencebaserede metrikker, der bruges til at måle kvaliteten af maskingenereret tekst — såsom oversættelser, resuméer eller output fra naturlig sproggenerering (NLG) — ved at sammenligne dem med en eller flere menneskeskrevne referencetekster. Feltet, der blev pioneret af Papineni et al. med BLEU i 2002, er vokset til at omfatte n-gram overlap-metrikker (BLEU, ROUGE) og semantisk bevidste metrikker (BERTScore, MoverScore), der fanger mening ud over overfladiske ordmatches.

Åbn i MethodMindSnartVideoSnartDownload slides

Læs hele metoden

Kun for medlemmer

Log ind med en gratis konto for at læse dette afsnit.

Log ind

Method map

The neighbourhood of related methods — select a node to explore.

Automatisk tekstevaluering

BERT-indlejringer Sentimentanalyse Tekstklassificering Emne-modellering Naturlig sproggenerering Tekstkohærensscore

Kilder

Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗

Sådan citerer du denne side

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/da/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side →

Refereret af

Naturlig sproggenerering Tekstkohærensscore

Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →