Morfološko raščlanjivanje — stabljikovanje i lematizacija
Morfološko raščlanjivanje dijeli riječi na njihove stabljike i afikse kako bi se različiti površinski oblici iste riječi mogli tretirati kao jedan. Obuhvaća dva komplementarna pristupa — stabljikovanje temeljeno na pravilima, poput algoritama Porter (1980) i Snowball, te lematizaciju svjesnu rječnika — i ključan je korak normalizacije teksta za aglutinativne jezike poput turskog i arapskog.
Pročitajte cijelu metodu
Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.
Method map
The neighbourhood of related methods — select a node to explore.
Izvori
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/hr/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Identifikacija jezika (LID)Rudarenje teksta↔ compare
- Analiza sentimentaRudarenje teksta↔ compare
- Segmentacija tekstaRudarenje teksta↔ compare
- TF-IDFRudarenje teksta↔ compare
Citirana u
Uočili ste pogrešku na ovoj stranici? Prijavite je ili predložite ispravak →