Analiza frekvencije teksta — Brojanje reči i n-grama
Analiza frekvencije teksta je deskriptivna metoda rudarenja tekstom koja broji koliko se često reči, n-grami i fraze pojavljuju u korpusu kako bi se otkrile obrasci sadržaja i dominantne teme. Ona se zasniva na uvidu u distribuciju frekvencija formalizovanom od strane George K. Zipfa (1949), da se nekoliko termina javlja veoma često dok je većina retka, i predstavlja jedan od najosnovnijih i najšire korišćenih ulaznih tačaka u kvantitativnu analizu teksta.
Pročitajte celu metodu
Prijavite se besplatnim nalogom da biste pročitali ovaj odeljak.
Method map
The neighbourhood of related methods — select a node to explore.
Izvori
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
Kako citirati ovu stranicu
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/sr/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Leksikološka raznovrsnostRudarenje teksta↔ compare
- Analiza sentimentaRudarenje teksta↔ compare
- TF-IDFRudarenje teksta↔ compare
- Modeliranje temaDuboko učenje↔ compare
Citirana u
Uočili ste grešku na ovoj stranici? Prijavite je ili predložite ispravku →