Process / pipeline

Automatisk tekstevaluering — BLEU, ROUGE, BERTScore

Automatisk tekstevaluering er en familie av referansebaserte metrikker som brukes til å måle kvaliteten på maskingenerert tekst — som oversettelser, sammendrag eller utdata fra naturlig språkgenerering (NLG) — ved å sammenligne dem med én eller flere menneskeskrevne referansetekster. Feltet, som ble pionert av Papineni et al. med BLEU i 2002, har vokst til å inkludere n-gram-overlappmetrikker (BLEU, ROUGE) og semantisk bevisste metrikker (BERTScore, MoverScore) som fanger opp mening utover overfladiske ordtreff.

Åpne i MethodMindSnartVideoSnartDownload slides

Les hele metoden

Kun for medlemmer

Logg inn med en gratis konto for å lese denne delen.

Logg inn

Method map

The neighbourhood of related methods — select a node to explore.

Automatisk tekstevaluering

BERT Embeddings Sentimentanalyse Tekstklassifisering Emne-modellering Naturlig språkgenerering Tekstkoherensskåring

Kilder

Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗

Slik siterer du denne siden

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/no/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT EmbeddingsTekstutvinning↔ compare
SentimentanalyseTekstutvinning↔ compare
TekstklassifiseringTekstutvinning↔ compare
Emne-modelleringDyp læring↔ compare

Compare side by side →

Referert av

Naturlig språkgenerering Tekstkoherensskåring

Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →