Process / pipeline
TF-IDF — 語頻-逆文書頻度
TF-IDFは、SaltonとBuckley (1988) によって導入された、各単語を文書内での出現頻度と文書集合全体での希少性によってスコアリングする単語重み付けスキームです。これは、生のテキストを重み付けされた文書ベクトルに変換し、1つの文書で頻繁に出現するが他では珍しい項に高い重みを与えます。
手法の全文を読む
会員限定
ログイン無料アカウントでログインすると、このセクションを読めます。
Method map
The neighbourhood of related methods — select a node to explore.
+13 more
出典
- Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗
このページの引用方法
ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/ja/text-mining/tf-idf
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →