Morfoligická analýza — Stemming a lemmatizácia
Morfoligická analýza rozdeľuje slová na ich korene a afixy, aby sa rôzne povrchové formy toho istého slova dali považovať za jednu. Zahŕňa dva komplementárne prístupy — stemming založený na pravidlách, ako sú algoritmy Porter (1980) a Snowball, a lemmatizáciu založenú na slovníku — a predstavuje kritický krok normalizácie textu pre aglutinačné jazyky, ako je turečtina a arabčina.
Prečítať celú metódu
Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Ako citovať túto stránku
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/sk/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Identifikácia jazyka (LID)Dolovanie textu↔ compare
- Analýza sentimentuDolovanie textu↔ compare
- Segmentácia textuDolovanie textu↔ compare
- TF-IDFDolovanie textu↔ compare
Odkazujú sem
Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →