Process / pipeline

Analýza frekvencie textu — Počty slov a n-gramov

Analýza frekvencie textu je deskriptívna metóda ťažby textu, ktorá počíta, ako často sa slová, n-gramy a frázy vyskytujú v korpuse, aby odhalila vzory obsahu a dominantné témy. Opiera sa o poznatok o rozdelení frekvencií formalizovaný Georgeom K. Zipfom (1949), že málo termínov sa vyskytuje veľmi často, zatiaľ čo väčšina je zriedkavá, a je to jeden z najzákladnejších a najširšie používaných vstupných bodov do kvantitatívnej analýzy textu.

Otvoriť v MethodMindČoskoroVideoČoskoroDownload slides

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link
  2. Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609

Ako citovať túto stránku

ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/sk/text-mining/frequency-analysis-text

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazujú sem

ScholarGateText Frequency Analysis (Text Frequency Analysis (Word and N-gram Frequency Analysis)). Získané 2026-06-15 z https://scholargate.app/sk/text-mining/frequency-analysis-text · Dátová sada: https://doi.org/10.5281/zenodo.20539026