Process / pipeline

형태소 분석 — 어간 추출 및 표제어 추출

형태소 분석은 단어를 어간과 접사로 분리하여 동일한 단어의 다른 표면 형태를 하나로 취급할 수 있도록 합니다. 이는 규칙 기반 어간 추출(예: Porter(1980) 및 Snowball 알고리즘)과 사전 기반 표제어 추출이라는 두 가지 상호 보완적인 접근 방식을 포함하며, 터키어 및 아랍어와 같은 교착어에 대한 중요한 텍스트 정규화 단계입니다.

MethodMind에서 열기곧 제공동영상곧 제공Download slides

방법 전문 읽기

회원 전용

무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.

로그인

Method map

The neighbourhood of related methods — select a node to explore.

출처

  1. Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814
  2. Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link

이 페이지 인용 방법

ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/ko/text-mining/morphological-analysis

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

이 방법을 참조하는 항목

ScholarGateMorphological Analysis (Morphological Analysis and Stemming). 2026-06-15에 다음에서 검색함: https://scholargate.app/ko/text-mining/morphological-analysis · 데이터셋: https://doi.org/10.5281/zenodo.20539026