Analiza morfologiczna — obcinanie rdzeni i lematyzacja
Analiza morfologiczna dzieli słowa na ich rdzenie i afiksy, tak aby różne formy powierzchniowe tego samego słowa mogły być traktowane jako jedna. Obejmuje ona dwa komplementarne podejścia — obcinanie rdzeni oparte na regułach, takie jak algorytmy Portera (1980) i Snowball, oraz lematyzację uwzględniającą słownik — i stanowi kluczowy etap normalizacji tekstu dla języków aglutynacyjnych, takich jak turecki i arabski.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/pl/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Identyfikacja języka (LID)Eksploracja tekstu↔ compare
- Analiza sentymentuEksploracja tekstu↔ compare
- Segmentacja tekstuEksploracja tekstu↔ compare
- TF-IDFEksploracja tekstu↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →