Process / pipeline
TF-IDF — 용어 빈도-역 문서 빈도
TF-IDF는 Salton과 Buckley(1988)가 소개한 것으로, 각 문서 내에서 단어의 빈도와 전체 말뭉치에서의 희소성을 점수화하는 용어 가중치 부여 방식입니다. 이는 원시 텍스트를 가중치 부여된 문서 벡터로 변환하여, 특정 문서에는 자주 나타나지만 다른 문서에는 드문 용어에 높은 가중치를 부여합니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
+13 more
출처
- Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗
이 페이지 인용 방법
ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/ko/text-mining/tf-idf
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →