ScholarGate
Ассистент
Process / pipeline

Морфологический анализ — стемминг и лемматизация

Морфологический анализ разделяет слова на их основы и аффиксы, чтобы различные поверхностные формы одного и того же слова могли рассматриваться как единое целое. Он охватывает два взаимодополняющих подхода — стемминг на основе правил, такой как алгоритмы Портера (Porter, 1980) и Snowball, и лемматизацию с учетом словаря — и является критически важным этапом нормализации текста для агглютинативных языков, таких как турецкий и арабский.

Открыть в MethodMindСкороВидеоСкороDownload slides

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Method map

The neighbourhood of related methods — select a node to explore.

Источники

  1. Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814
  2. Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link

Как цитировать эту страницу

ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/ru/text-mining/morphological-analysis

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Упоминается в

ScholarGateMorphological Analysis (Morphological Analysis and Stemming). Получено 2026-06-15 из https://scholargate.app/ru/text-mining/morphological-analysis · Набор данных: https://doi.org/10.5281/zenodo.20539026