Morfologisk analyse — Stamme- og lemmatisering
Morfologisk analyse deler ord inn i stammer og affikser slik at ulike overflateformer av samme ord kan behandles som ett. Den omfatter to komplementære tilnærminger — regelbasert stemming, som Porter (1980) og Snowball-algoritmene, og ordbokbasert lemmatisering — og er et kritisk tekstnormaliseringstrinn for agglutinerende språk som tyrkisk og arabisk.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Slik siterer du denne siden
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/no/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Språkgjenkjenning (LID)Tekstutvinning↔ compare
- SentimentanalyseTekstutvinning↔ compare
- TekstsegmenteringTekstutvinning↔ compare
- TF-IDFTekstutvinning↔ compare
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →