Process / pipeline

Szöveggyakoriság-elemzés — Szó- és N-gram-számok

A szöveggyakoriság-elemzés egy leíró szövegbányászati módszer, amely megszámolja, hogy a szavak, n-gramok és kifejezések milyen gyakran fordulnak elő egy korpuszban, feltárva ezzel a tartalmi mintázatokat és a domináns témákat. George K. Zipf (1949) által formalizált gyakorisági eloszlás felismerésén alapul, miszerint kevés kifejezés fordul elő nagyon gyakran, míg a legtöbb ritka, és ez az egyik legalapvetőbb és legszélesebben használt kiindulópont a kvantitatív szövegelemzésben.

Megnyitás itt: MethodMindHamarosanVideóHamarosanDownload slides

A teljes módszer elolvasása

Csak tagoknak

Jelentkezzen be ingyenes fiókkal a szakasz elolvasásához.

Bejelentkezés

Method map

The neighbourhood of related methods — select a node to explore.

Források

  1. Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link
  2. Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609

Hogyan hivatkozzon erre az oldalra

ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/hu/text-mining/frequency-analysis-text

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Hivatkozik rá

ScholarGateText Frequency Analysis (Text Frequency Analysis (Word and N-gram Frequency Analysis)). Letöltve 2026-06-15, forrás: https://scholargate.app/hu/text-mining/frequency-analysis-text · Adatkészlet: https://doi.org/10.5281/zenodo.20539026