ScholarGate
Асистент
Process / pipeline

Морфологічний аналіз — Стемінг та лематизація

Морфологічний аналіз розбиває слова на їхні основи та афікси, щоб різні поверхневі форми одного слова можна було розглядати як одне. Він охоплює два взаємодоповнювальні підходи — стемування на основі правил, таке як алгоритми Портера (1980) та Snowball, і лематизацію з урахуванням словника — і є критичним кроком нормалізації тексту для аглютинативних мов, таких як турецька та арабська.

Відкрити у MethodMindНезабаромВідеоНезабаромDownload slides

Читати метод повністю

Лише для учасників

Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.

Увійти

Method map

The neighbourhood of related methods — select a node to explore.

Джерела

  1. Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814
  2. Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link

Як цитувати цю сторінку

ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/uk/text-mining/morphological-analysis

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Згадується в

ScholarGateMorphological Analysis (Morphological Analysis and Stemming). Отримано 2026-06-15 з https://scholargate.app/uk/text-mining/morphological-analysis · Набір даних: https://doi.org/10.5281/zenodo.20539026