पाठ आवृत्ति विश्लेषण — शब्द और एन-ग्राम गणना
पाठ आवृत्ति विश्लेषण एक वर्णनात्मक पाठ-खनन विधि है जो सामग्री पैटर्न और प्रमुख विषयों को प्रकट करने के लिए एक कॉर्पस में शब्दों, एन-ग्राम और वाक्यांशों की आवृत्ति की गणना करती है। यह जॉर्ज के. ज़िपफ़ (1949) द्वारा औपचारिक रूप से प्रस्तुत आवृत्ति-वितरण अंतर्दृष्टि पर आधारित है, कि कुछ शब्द बहुत बार आते हैं जबकि अधिकांश दुर्लभ होते हैं, और यह मात्रात्मक पाठ विश्लेषण के सबसे बुनियादी और व्यापक रूप से उपयोग किए जाने वाले प्रवेश बिंदुओं में से एक है।
पूरी विधि पढ़ें
यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।
Method map
The neighbourhood of related methods — select a node to explore.
स्रोत
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
इस पृष्ठ का उद्धरण कैसे दें
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/hi/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- शाब्दिक विविधतापाठ खनन↔ compare
- भाव विश्लेषणपाठ खनन↔ compare
- TF-IDFपाठ खनन↔ compare
- विषय मॉडलिंगगहन अधिगम↔ compare