Morfologisk analyse — Stemming og lemmatisering
Morfologisk analyse opdeler ord i deres stammer og affikser, så forskellige overfladeformer af det samme ord kan behandles som ét. Den dækker to komplementære tilgange — regelbaseret stemming, såsom Porter (1980) og Snowball-algoritmerne, og ordbogsbevidst lemmatisering — og er et kritisk tekstnormaliseringstrin for agglutinerende sprog som tyrkisk og arabisk.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/da/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Sprogidentifikation (LID)Tekstmining↔ compare
- SentimentanalyseTekstmining↔ compare
- TekstsegmenteringTekstmining↔ compare
- TF-IDFTekstmining↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →