Tekstfrekvensanalyse — Ord- og N-gram-tællinger
Tekstfrekvensanalyse er en deskriptiv tekstminedriftsmetode, der tæller, hvor ofte ord, n-grammer og fraser forekommer i et korpus for at afsløre indholdsmønstre og dominerende temaer. Den bygger på den indsigt om frekvensfordeling, som George K. Zipf (1949) formaliserede, nemlig at få termer forekommer meget ofte, mens de fleste er sjældne, og den er et af de mest grundlæggende og udbredte udgangspunkter for kvantitativ tekstanalyse.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
Sådan citerer du denne side
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/da/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Lexical DiversityTekstmining↔ compare
- SentimentanalyseTekstmining↔ compare
- TF-IDFTekstmining↔ compare
- Emne-modelleringDyb læring↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →