Морфологичен анализ — Стеминг и лематизация
Морфологичният анализ разделя думите на техните основи и афикси, така че различните повърхностни форми на една и съща дума да могат да се третират като една. Той обхваща два допълващи се подхода — базиран на правила стеминг, като алгоритмите на Porter (1980) и Snowball, и лематизация, съобразена с речника — и е критична стъпка за нормализиране на текст при аглутинативни езици като турски и арабски.
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Method map
The neighbourhood of related methods — select a node to explore.
Източници
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Как да цитирате тази страница
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/bg/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Езикова идентификация (LID)Извличане на текст↔ compare
- Анализ на настроениятаИзвличане на текст↔ compare
- Сегментиране на текстИзвличане на текст↔ compare
- TF-IDFИзвличане на текст↔ compare
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →