Process / pipeline

Analiza frekvencije teksta — Brojanje riječi i n-grama

Analiza frekvencije teksta je deskriptivna metoda rudarenja tekstom koja broji koliko se često riječi, n-grami i fraze pojavljuju u korpusu kako bi se otkrile obrasci sadržaja i dominantne teme. Ona se temelji na uvidu u raspodjelu frekvencija formaliziranom od strane Georgea K. Zipfa (1949.), da se nekoliko pojmova pojavljuje vrlo često dok je većina rijetka, te je jedan od najosnovnijih i najčešće korištenih ulaznih točaka u kvantitativnu analizu teksta.

Otvorite u MethodMindUskoroVideoUskoroDownload slides

Pročitajte cijelu metodu

Samo za članove

Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.

Prijavite se

Method map

The neighbourhood of related methods — select a node to explore.

Izvori

  1. Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link
  2. Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609

Kako citirati ovu stranicu

ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/hr/text-mining/frequency-analysis-text

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citirana u

ScholarGateText Frequency Analysis (Text Frequency Analysis (Word and N-gram Frequency Analysis)). Preuzeto 2026-06-15 s https://scholargate.app/hr/text-mining/frequency-analysis-text · Skup podataka: https://doi.org/10.5281/zenodo.20539026