تحليل تكرار النصوص — عدّ الكلمات والمتتاليات (N-grams)
يُعدّ تحليل تكرار النصوص طريقة وصفية في التنقيب عن النصوص تقوم بعدّ عدد مرات تكرار الكلمات، والمتتاليات (n-grams)، والعبارات في مجموعة نصوص (corpus) للكشف عن أنماط المحتوى والموضوعات المهيمنة. تستند هذه الطريقة إلى فكرة التوزيع التكراري التي صاغها جورج ك. زيبف (Zipf, 1949)، والتي تنص على أن عدداً قليلاً من المصطلحات يتكرر كثيراً بينما يكون معظمها نادراً، وهي تُعدّ من أبسط نقاط الدخول وأكثرها استخداماً في التحليل الكمي للنصوص.
اقرأ الطريقة كاملة
سجّل الدخول بحساب مجاني لقراءة هذا القسم.
Method map
The neighbourhood of related methods — select a node to explore.
المصادر
- Zipf, G. K. (1949). Human Behavior and the Principle of Least Effort. Addison-Wesley. link ↗
- Manning, C. D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
كيف تستشهد بهذه الصفحة
ScholarGate. (2026, June 1). Text Frequency Analysis (Word and N-gram Frequency Analysis). ScholarGate. https://scholargate.app/ar/text-mining/frequency-analysis-text
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- التنوع المعجميتنقيب النصوص↔ compare
- تحليل المشاعرتنقيب النصوص↔ compare
- تكرار المصطلح - التردد العكسي لتكرار المصطلحتنقيب النصوص↔ compare
- نمذجة الموضوعاتالتعلم العميق↔ compare