Process / pipeline
テキスト頻度分析 — 単語とN-グラムのカウント
テキスト頻度分析は、単語、N-グラム、フレーズがコーパス内でどのくらいの頻度で出現するかを数える記述的なテキストマイニング手法であり、内容パターンと主要なテーマを明らかにするものです。これは、George K. Zipf (1949) によって定式化された頻度分布の洞察、すなわち少数の用語が非常に頻繁に出現し、ほとんどの用語は稀であるという考えに基づいています。これは、定量的テキスト分析への最も基本的で広く用いられている入り口の一つです。
手法の全文を読む
会員限定
ログイン無料アカウントでログインすると、このセクションを読めます。
Method map
The neighbourhood of related methods — select a node to explore.
出典
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
このページの引用方法
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/ja/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →