لسانيات المدونات ومدونات الويب
دراسة اللغة من خلال عينات كبيرة من النصوص الأصيلة: بناء المدونات والاستعلام عنها، وقياس المتلازمات والتكرارات، وتسخير الويب كمورد لغوي هائل.
Definition
لسانيات المدونات هي الدراسة التجريبية للغة بناءً على مجموعات منهجية من النصوص الطبيعية، تُحلل باستخدام مقاييس التكرار والتوافق والارتباط.
Scope
يغطي تصميم وتجميع وتحليل المدونات النصية — أخذ العينات والتوازن، وتحليل التوافقات والكلمات المفتاحية، وإحصائيات التكرار والمتلازمات مثل المعلومات المتبادلة، واستخدام الويب كمدونة. ويتناول كلاً من لسانيات المدونات الوصفية وتوفير البيانات للأنظمة الحاسوبية. وتُغطى مخططات التعليقات التوضيحية وبنوك الشجر في موضوع ذي صلة.
Core questions
- كيف تُؤخذ عينات المدونات لتمثيل تنوع لغوي بشكل عادل؟
- كيف تكشف مقاييس الارتباط مثل المعلومات المتبادلة عن المتلازمات؟
- ما هي فوائد ومخاطر استخدام الويب كمدونة؟
- كيف تدعم التوافقات التحليل اللغوي والمعجمي؟
Key concepts
- تصميم المدونات
- التوافق
- المتلازمة
- المعلومات المتبادلة النقطية
- توزيع التكرار
- تحليل الكلمات المفتاحية
- الويب كمدونة
- المدونة المتوازنة
Key theories
- مقاييس الارتباط للمتلازمات
- استخدام الإحصائيات مثل المعلومات المتبادلة النقطية للكشف عن أزواج الكلمات التي تترافق أكثر من مجرد الصدفة، مما يكشف عن المتلازمات ويدعم علم المعاجم.
- الويب كمدونة
- التعامل مع الويب كمدونة ضخمة، وإن كانت غير خاضعة للتحكم، مما يتيح دراسة الظواهر النادرة والتنوعات قليلة الموارد مع إثارة تساؤلات حول التمثيلية.
History
نشأت لسانيات المدونات من مشاريع سنكلير المعجمية وبناء المدونات المتوازنة، بينما أدخل عمل تشرش وهانكس عام 1989 حول المعلومات المتبادلة مقاييس الارتباط الإحصائي إلى التيار السائد. وقد أثبت كيلغاريف وغريفينستيت لاحقًا أن الويب مدونة شرعية، وإن كانت صاخبة، ذات نطاق غير مسبوق.
Debates
- تمثيلية بيانات الويب
- مدونات الويب ضخمة ولكنها غير متوازنة ويصعب وصفها، مما يثير جدلاً حول مدى تعميم الاستنتاجات المستخلصة منها على اللغة ككل.
Key figures
- Adam Kilgarriff
- Kenneth Church
- Patrick Hanks
- John Sinclair
Related topics
Seminal works
- church1989
- kilgarriff2003
Frequently asked questions
- ما هي المتلازمة؟
- المتلازمة هي زوج أو مجموعة من الكلمات التي تترافق عادةً معًا أكثر مما تتنبأ به الصدفة، مثل 'شاي قوي' بدلاً من 'شاي فعال'. تساعد مقاييس الارتباط في الكشف عنها تلقائيًا.