Tekstfrekvensanalyse — Ordtelling og n-gram-telling
Tekstfrekvensanalyse er en beskrivende metode innen tekstutvinning som teller hvor ofte ord, n-gram og fraser forekommer i et korpus for å avdekke innholdsmønstre og dominerende temaer. Metoden bygger på innsikten om frekvensfordeling formalisert av George K. Zipf (1949), at få ord forekommer svært ofte mens de fleste er sjeldne, og den er en av de mest grunnleggende og vidt anvendte inngangene til kvantitativ tekstanalyse.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
Slik siterer du denne siden
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/no/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Leksikalsk mangfoldTekstutvinning↔ compare
- SentimentanalyseTekstutvinning↔ compare
- TF-IDFTekstutvinning↔ compare
- Emne-modelleringDyp læring↔ compare
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →