لغات ومعايير الترميز
الترميز هو طبقة من الرموز تحول تدفقًا من الأحرف إلى مستند منظم. لقد شكّل التمييز بين الترميز الوصفي، الذي يسمي ماهية الشيء، والترميز الإجرائي، الذي يحدد كيفية طباعته، المعايير — SGML و XML وخلفاءهما — التي يعتمد عليها ترميز العلوم الإنسانية.
Definition
اللغات الرسمية ومعايير المجتمع — لا سيما SGML و XML — المستخدمة لإضافة رموز منظمة قابلة للقراءة آليًا إلى المستندات، جنبًا إلى جنب مع المبادئ التي تجعل هذا الترميز وصفيًا وقابلاً للتحقق وقابلاً للتبادل.
Scope
يغطي اللغات والمعايير التي يقوم عليها ترميز النصوص: تاريخ الترميز العام والوصفي، SGML و XML ولغات المخططات الخاصة بهما، والمبادئ التي تميز الترميز القوي والقابل للتبادل عن الترميز الموجه نحو العرض. يتضمن تأثير هذه المعايير على الحوسبة في العلوم الإنسانية.
Core questions
- ما الذي يميز الترميز الوصفي عن الترميز الإجرائي والترميز العرضي؟
- لماذا تقاربت العلوم الإنسانية على SGML ثم XML؟
- كيف تقيد المخططات المستندات المرمزة وتتحقق من صحتها؟
- ما هي حدود لغات الترميز ذات البنية الشجرية؟
Key concepts
- SGML
- XML
- الترميز الوصفي مقابل الترميز الإجرائي
- المخطط و DTD
- التكوين الجيد والصلاحية
Key theories
- الترميز الوصفي على الترميز الإجرائي
- جادل Coombs و Renear و DeRose بأن الترميز الذي يسمي الدور المنطقي للنص (وصفي) يتفوق في البحث العلمي على الترميز الذي يحدد المظهر (إجرائي)، لأنه يحافظ على المعنى ويدعم إعادة الاستخدام.
- الترميز العام وفصل الاهتمامات
- إن فصل البنية المنطقية للمستند عن عرضه يسمح لمصدر مشفر واحد بتشغيل التحليل والبحث والعروض المتعددة، وهو مبدأ موروث من SGML وانتقل إلى XML.
- نموذج المستند الهرمي
- تنمذج XML وسابقاتها المستندات كأشجار مرتبة، وهو أمر قوي للبنية المتداخلة ولكنه يواجه صعوبة مع الميزات التي تتداخل عبر التسلسل الهرمي.
History
أدت أفكار الترميز العام في أواخر الستينيات إلى GML ثم SGML، الذي تم توحيده في عام 1986. قدمت ورقة Coombs-Renear-DeRose لعام 1987 حجة للترميز الوصفي في البحث العلمي. تم نشر XML، وهو ملف تعريف SGML مبسط، بواسطة W3C في عام 1998 وسرعان ما أصبح الأساس لـ TEI P5 ومعظم ترميز العلوم الإنسانية.
Debates
- مدى كفاية الترميز القائم على الشجرة
- نظرًا لأن XML يفرض تسلسلاً هرميًا واحدًا، فإن الهياكل المتداخلة الشائعة في النصوص الحقيقية تتطلب حلولًا بديلة، مما يغذي البحث في نماذج ترميز بديلة أو تكميلية.
Key figures
- James H. Coombs
- Allen Renear
- Steven DeRose
Related topics
Seminal works
- coombs1987
- delittle1990
Frequently asked questions
- هل لا يزال XML ذا صلة بالنظر إلى التنسيقات الأحدث مثل JSON؟
- بالنسبة لترميز العلوم الإنسانية المرتكز على المستندات، لا يزال XML مهيمنًا لأنه يعبر عن بنية غنية وقابلة للتحقق ويقوم عليها TEI. تُعد JSON والتنسيقات الأخرى شائعة لتبادل البيانات، لكن تقليد الترميز الوصفي لا يزال محوريًا لتمثيل النصوص الأكاديمية.