Process / pipeline

TF-IDF — 語頻-逆文書頻度

TF-IDFは、SaltonとBuckley (1988) によって導入された、各単語を文書内での出現頻度と文書集合全体での希少性によってスコアリングする単語重み付けスキームです。これは、生のテキストを重み付けされた文書ベクトルに変換し、1つの文書で頻繁に出現するが他では珍しい項に高い重みを与えます。

MethodMindで開く近日公開動画近日公開Download slides

手法の全文を読む

会員限定

無料アカウントでログインすると、このセクションを読めます。

ログイン

Method map

The neighbourhood of related methods — select a node to explore.

TF-IDF

感情分析テキスト分類 Word2Vec 共起分析 Doc2Vec 文書クラスタリング偽ニュース検出 GloVe埋め込みキーワード抽出語彙の多様性

+13 more

出典

Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗

このページの引用方法

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/ja/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

感情分析テキストマイニング↔ compare
テキスト分類テキストマイニング↔ compare
Word2Vecテキストマイニング↔ compare

Compare side by side →

このページに誤りを見つけましたか?報告・修正提案 →

手法の全文を読む

Method map

出典

このページの引用方法

関連手法

Which method?

この手法を参照する項目