Analiza frecvenței textului — Număr de cuvinte și N-grame
Analiza frecvenței textului este o metodă descriptivă de extragere a informațiilor din text (text mining) care numără cât de des apar cuvinte, n-grame și fraze într-un corpus pentru a dezvălui tipare de conținut și teme dominante. Se bazează pe intuiția distribuției de frecvență formalizată de George K. Zipf (1949), conform căreia puține termeni apar foarte des, în timp ce majoritatea sunt rari, și reprezintă unul dintre cele mai elementare și utilizate puncte de intrare în analiza cantitativă a textului.
Citește metoda completă
Autentifică-te cu un cont gratuit pentru a citi această secțiune.
Method map
The neighbourhood of related methods — select a node to explore.
Surse
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
Cum se citează această pagină
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/ro/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Diversitatea LexicalăMineritul textelor↔ compare
- Analiza sentimentelorMineritul textelor↔ compare
- TF-IDFMineritul textelor↔ compare
- Modelarea tematicăÎnvățare profundă↔ compare
Citat de
Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →