Szöveggyakoriság-elemzés — Szó- és N-gram-számok
A szöveggyakoriság-elemzés egy leíró szövegbányászati módszer, amely megszámolja, hogy a szavak, n-gramok és kifejezések milyen gyakran fordulnak elő egy korpuszban, feltárva ezzel a tartalmi mintázatokat és a domináns témákat. George K. Zipf (1949) által formalizált gyakorisági eloszlás felismerésén alapul, miszerint kevés kifejezés fordul elő nagyon gyakran, míg a legtöbb ritka, és ez az egyik legalapvetőbb és legszélesebben használt kiindulópont a kvantitatív szövegelemzésben.
A teljes módszer elolvasása
Jelentkezzen be ingyenes fiókkal a szakasz elolvasásához.
Method map
The neighbourhood of related methods — select a node to explore.
Források
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
Hogyan hivatkozzon erre az oldalra
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/hu/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Lexikai sokféleségSzövegbányászat↔ compare
- Szöveges hangulatelemzésSzövegbányászat↔ compare
- TF-IDFSzövegbányászat↔ compare
- Tematikus modellezésMélytanulás↔ compare
Hivatkozik rá
Hibát talált ezen az oldalon? Jelentse, vagy javasoljon javítást →