Process / pipeline

Автоматическая оценка текста — BLEU, ROUGE, BERTScore

Автоматическая оценка текста — это семейство метрик, основанных на сравнении с эталонными данными и используемых для измерения качества текста, сгенерированного машиной (например, переводов, резюме или результатов генерации естественного языка (NLG)), путём сопоставления его с одним или несколькими эталонными текстами, написанными человеком. Эта область, впервые разработанная Папинени и соавт. с метрикой BLEU в 2002 году, расширилась и теперь включает метрики наложения n-грамм (BLEU, ROUGE) и семантически ориентированные метрики (BERTScore, MoverScore), которые учитывают значение, выходящее за рамки поверхностного совпадения слов.

Открыть в MethodMindСкороВидеоСкороDownload slides

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Method map

The neighbourhood of related methods — select a node to explore.

Источники

  1. Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link
  2. Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link

Как цитировать эту страницу

ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/ru/text-mining/automatic-text-evaluation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Упоминается в

ScholarGateAutomatic Text Evaluation (Automatic Text Evaluation (BLEU, ROUGE, BERTScore)). Получено 2026-06-15 из https://scholargate.app/ru/text-mining/automatic-text-evaluation · Набор данных: https://doi.org/10.5281/zenodo.20539026