ScholarGate
アシスタント
Process / pipeline

TF-IDF — 語頻-逆文書頻度

TF-IDFは、SaltonとBuckley (1988) によって導入された、各単語を文書内での出現頻度と文書集合全体での希少性によってスコアリングする単語重み付けスキームです。これは、生のテキストを重み付けされた文書ベクトルに変換し、1つの文書で頻繁に出現するが他では珍しい項に高い重みを与えます。

MethodMindで開く近日公開動画近日公開Download slides

手法の全文を読む

会員限定

無料アカウントでログインすると、このセクションを読めます。

ログイン

Method map

The neighbourhood of related methods — select a node to explore.

+13 more

出典

  1. Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0

このページの引用方法

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/ja/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

この手法を参照する項目

ScholarGateTF-IDF (Term Frequency–Inverse Document Frequency Vectorization). 2026-06-15に以下より取得 https://scholargate.app/ja/text-mining/tf-idf · データセット: https://doi.org/10.5281/zenodo.20539026