ارزیابی خودکار متن — BLEU، ROUGE، BERTScore
ارزیابی خودکار متن خانوادهای از معیارهای مبتنی بر مرجع است که برای اندازهگیری کیفیت متن تولید شده توسط ماشین — مانند ترجمهها، خلاصهها، یا خروجیهای تولید زبان طبیعی (NLG) — با مقایسه آنها با یک یا چند متن مرجع نوشته شده توسط انسان استفاده میشود. این حوزه که توسط Papineni و همکارانش با BLEU در سال ۲۰۰۲ پیشگام شد، رشد کرده و شامل معیارهای همپوشانی n-گرم (BLEU، ROUGE) و معیارهای آگاه از معنایی (BERTScore، MoverScore) میشود که معنا را فراتر از تطابق کلمات سطحی درک میکنند.
مطالعهٔ کامل روش
برای خواندن این بخش با حساب رایگان وارد شوید.
Method map
The neighbourhood of related methods — select a node to explore.
منابع
- Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2002). BLEU: A Method for Automatic Evaluation of Machine Translation. Proceedings of ACL 2002. link ↗
- Zhang, T., Kishore, V., Wu, F., Weinberger, K. Q., & Artzi, Y. (2020). BERTScore: Evaluating Text Generation with BERT. Proceedings of ICLR 2020. link ↗
نحوهٔ استناد به این صفحه
ScholarGate. (2026, June 1). Automatic Text Evaluation (BLEU, ROUGE, BERTScore). ScholarGate. https://scholargate.app/fa/text-mining/automatic-text-evaluation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT Embeddingsمتنکاوی↔ compare
- تحلیل احساساتمتنکاوی↔ compare
- طبقهبندی متنمتنکاوی↔ compare
- مدلسازی موضوعییادگیری عمیق↔ compare
ارجاعشده در
در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →