Process / pipeline

TF-IDF — 용어 빈도-역 문서 빈도

TF-IDF는 Salton과 Buckley(1988)가 소개한 것으로, 각 문서 내에서 단어의 빈도와 전체 말뭉치에서의 희소성을 점수화하는 용어 가중치 부여 방식입니다. 이는 원시 텍스트를 가중치 부여된 문서 벡터로 변환하여, 특정 문서에는 자주 나타나지만 다른 문서에는 드문 용어에 높은 가중치를 부여합니다.

MethodMind에서 열기곧 제공동영상곧 제공Download slides

방법 전문 읽기

회원 전용

무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.

로그인

Method map

The neighbourhood of related methods — select a node to explore.

TF-IDF

감성 분석 텍스트 분류 Word2Vec 단어 동시 출현 분석 Doc2Vec 문서 군집화 가짜 뉴스 탐지 GloVe 임베딩 키워드 추출 어휘 다양성

+13 more

출처

Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗

이 페이지 인용 방법

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/ko/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

감성 분석텍스트 마이닝↔ compare
텍스트 분류텍스트 마이닝↔ compare
Word2Vec텍스트 마이닝↔ compare

Compare side by side →

이 페이지에서 오류를 발견하셨나요? 신고하거나 수정을 제안하세요 →

방법 전문 읽기

Method map

출처

이 페이지 인용 방법

관련 방법

Which method?

이 방법을 참조하는 항목