Morfologická analýza — Stemming a lemmatizace
Morfologická analýza rozděluje slova na jejich kořeny a afixy, aby bylo možné různé povrchové formy téhož slova považovat za jednu. Zahrnuje dva komplementární přístupy — stemming založený na pravidlech, jako jsou algoritmy Porter (1980) a Snowball, a lemmatizaci s využitím slovníku — a je kritickým krokem normalizace textu pro aglutinační jazyky, jako je turečtina a arabština.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/cs/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Identifikace jazyka (LID)Dolování textu↔ compare
- Analýza sentimentuDolování textu↔ compare
- Segmentace textuDolování textu↔ compare
- TF-IDFDolování textu↔ compare
Odkazuje sem
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →