Morfológiai elemzés — Sztemmelés és lemmatizálás
A morfológiai elemzés a szavakat tőre és toldalékokra bontja, hogy ugyanazon szó különböző felszíni formái egységként kezelhetők legyenek. Két kiegészítő megközelítést foglal magában — szabályalapú sztremmelést (mint például a Porter (1980) és a Snowball algoritmusok), valamint szótáralapú lemmatizálást —, és kritikus szövegnormalizálási lépés az agglutináló nyelvek, például a török és az arab esetében.
A teljes módszer elolvasása
Jelentkezzen be ingyenes fiókkal a szakasz elolvasásához.
Method map
The neighbourhood of related methods — select a node to explore.
Források
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
Hogyan hivatkozzon erre az oldalra
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/hu/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Nyelvazonosítás (LID)Szövegbányászat↔ compare
- Szöveges hangulatelemzésSzövegbányászat↔ compare
- SzövegszegmentálásSzövegbányászat↔ compare
- TF-IDFSzövegbányászat↔ compare
Hivatkozik rá
Hibát talált ezen az oldalon? Jelentse, vagy javasoljon javítást →