ScholarGate
Asistent
Process / pipeline

Morfoligická analýza — Stemming a lemmatizácia

Morfoligická analýza rozdeľuje slová na ich korene a afixy, aby sa rôzne povrchové formy toho istého slova dali považovať za jednu. Zahŕňa dva komplementárne prístupy — stemming založený na pravidlách, ako sú algoritmy Porter (1980) a Snowball, a lemmatizáciu založenú na slovníku — a predstavuje kritický krok normalizácie textu pre aglutinačné jazyky, ako je turečtina a arabčina.

Otvoriť v MethodMindČoskoroVideoČoskoroDownload slides

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814
  2. Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link

Ako citovať túto stránku

ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/sk/text-mining/morphological-analysis

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazujú sem

ScholarGateMorphological Analysis (Morphological Analysis and Stemming). Získané 2026-06-15 z https://scholargate.app/sk/text-mining/morphological-analysis · Dátová sada: https://doi.org/10.5281/zenodo.20539026