Analýza frekvencie textu — Počty slov a n-gramov
Analýza frekvencie textu je deskriptívna metóda ťažby textu, ktorá počíta, ako často sa slová, n-gramy a frázy vyskytujú v korpuse, aby odhalila vzory obsahu a dominantné témy. Opiera sa o poznatok o rozdelení frekvencií formalizovaný Georgeom K. Zipfom (1949), že málo termínov sa vyskytuje veľmi často, zatiaľ čo väčšina je zriedkavá, a je to jeden z najzákladnejších a najširšie používaných vstupných bodov do kvantitatívnej analýzy textu.
Prečítať celú metódu
Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
Ako citovať túto stránku
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/sk/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Lexikálna diverzitaDolovanie textu↔ compare
- Analýza sentimentuDolovanie textu↔ compare
- TF-IDFDolovanie textu↔ compare
- Modelovanie témHlboké učenie↔ compare
Odkazujú sem
Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →