Analiza e Frekuencës së Tekstit — Numërimi i Fjalëve dhe N-grameve
Analiza e frekuencës së tekstit është një metodë përshkruese e nxjerrjes së të dhënave nga teksti (text-mining) që numëron sa shpesh shfaqen fjalët, n-gramet dhe frazat në një korpus, për të zbuluar modelet e përmbajtjes dhe temat dominuese. Ajo bazohet në thelbin e shpërndarjes së frekuencave, të formalizuar nga George K. Zipf (1949), sipas të cilit pak terma shfaqen shumë shpesh ndërsa shumica janë të rrallë, dhe është një nga pikat hyrëse më themelore dhe më të përdorura në analizën sasiore të tekstit.
Lexoni metodën e plotë
Hyni me një llogari falas për ta lexuar këtë seksion.
Method map
The neighbourhood of related methods — select a node to explore.
Burimet
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
Si ta citoni këtë faqe
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/sq/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Pasuria LeksikoreNxjerrja e tekstit↔ compare
- Analiza e ndjenjaveNxjerrja e tekstit↔ compare
- TF-IDFNxjerrja e tekstit↔ compare
- Modelimi i temaveMësimi i thellë↔ compare
Cituar nga
Vutë re një problem në këtë faqe? Raportojeni ose sugjeroni një korrigjim →