Automatisk tekstevaluering — BLEU, ROUGE, BERTScore
Automatisk tekstevaluering er en familie af referencebaserede metrikker, der bruges til at måle kvaliteten af maskingenereret tekst — såsom oversættelser, resuméer eller output fra naturlig sproggenerering (NLG) — ved at sammenligne dem med en eller flere menneskeskrevne referencetekster. Feltet, der blev pioneret af Papineni et al. med BLEU i 2002, er vokset til at omfatte n-gram overlap-metrikker (BLEU, ROUGE) og semantisk bevidste metrikker (BERTScore, MoverScore), der fanger mening ud over overfladiske ordmatches.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
- Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/da/text-mining/automatic-text-evaluation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-indlejringerTekstmining↔ compare
- SentimentanalyseTekstmining↔ compare
- TekstklassificeringTekstmining↔ compare
- Emne-modelleringDyb læring↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →