Process / pipeline
형태소 분석 — 어간 추출 및 표제어 추출
형태소 분석은 단어를 어간과 접사로 분리하여 동일한 단어의 다른 표면 형태를 하나로 취급할 수 있도록 합니다. 이는 규칙 기반 어간 추출(예: Porter(1980) 및 Snowball 알고리즘)과 사전 기반 표제어 추출이라는 두 가지 상호 보완적인 접근 방식을 포함하며, 터키어 및 아랍어와 같은 교착어에 대한 중요한 텍스트 정규화 단계입니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
출처
- Porter, M.F. (1980). An Algorithm for Suffix Stripping. Program, 14(3), 130-137. DOI: 10.1108/eb046814 ↗
- Schmid, H. (1994). Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing (NEMLAP). link ↗
이 페이지 인용 방법
ScholarGate. (2026, June 1). Morphological Analysis and Stemming. ScholarGate. https://scholargate.app/ko/text-mining/morphological-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- 언어 식별 (LID)텍스트 마이닝↔ compare
- 감성 분석텍스트 마이닝↔ compare
- Text Segmentation텍스트 마이닝↔ compare
- TF-IDF텍스트 마이닝↔ compare