ScholarGate
어시스턴트
Process / pipeline

TF-IDF — 용어 빈도-역 문서 빈도

TF-IDF는 Salton과 Buckley(1988)가 소개한 것으로, 각 문서 내에서 단어의 빈도와 전체 말뭉치에서의 희소성을 점수화하는 용어 가중치 부여 방식입니다. 이는 원시 텍스트를 가중치 부여된 문서 벡터로 변환하여, 특정 문서에는 자주 나타나지만 다른 문서에는 드문 용어에 높은 가중치를 부여합니다.

MethodMind에서 열기곧 제공동영상곧 제공Download slides

방법 전문 읽기

회원 전용

무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.

로그인

Method map

The neighbourhood of related methods — select a node to explore.

+13 more

출처

  1. Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0

이 페이지 인용 방법

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/ko/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

이 방법을 참조하는 항목

ScholarGateTF-IDF (Term Frequency–Inverse Document Frequency Vectorization). 2026-06-15에 다음에서 검색함: https://scholargate.app/ko/text-mining/tf-idf · 데이터셋: https://doi.org/10.5281/zenodo.20539026