Morfoloģiskā analīze — sakņošana un lemmatizācija
Morfoloģiskā analīze sadala vārdus to saknēs un afiksos, lai dažādas vārda virsmas formas varētu apstrādāt kā vienu. Tā ietver divas papildinošas pieejas — uz noteikumiem balstītu sakņošanu, piemēram, Portera (1980) un Snowball algoritmus, un vārdnīcās balstītu lemmatizāciju — un ir kritisks teksta normalizācijas solis aglutinatīvām valodām, piemēram, turku un arābu valodai.
Lasīt pilno metodes aprakstu
Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.
Method map
The neighbourhood of related methods — select a node to explore.
Avoti
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Kā citēt šo lapu
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/lv/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Valodu identifikācija (LID)Teksta ieguve↔ compare
- Sentimentu analīzeTeksta ieguve↔ compare
- Teksta segmentēšanaTeksta ieguve↔ compare
- TF-IDFTeksta ieguve↔ compare
Uz to atsaucas
Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →