زبانها و استانداردهای نشانهگذاری
نشانهگذاری لایهای از کدها است که جریانی از کاراکترها را به یک سند ساختاریافته تبدیل میکند. تمایز بین نشانهگذاری توصیفی، که ماهیت یک چیز را نامگذاری میکند، و نشانهگذاری رویهای، که نحوه چاپ آن را بیان میکند، استانداردهایی — SGML، XML و جانشینان آنها — را شکل داده است که رمزگذاری علوم انسانی بر آن استوار است.
Definition
زبانهای رسمی و استانداردهای جامعه — به ویژه SGML و XML — که برای افزودن کدهای ساختاریافته و قابل خواندن توسط ماشین به اسناد استفاده میشوند، همراه با اصولی که چنین نشانهگذاری را توصیفی، قابل اعتبارسنجی و قابل تبادل میسازد.
Scope
زبانها و استانداردهایی را پوشش میدهد که زیربنای رمزگذاری متن هستند: تاریخچه نشانهگذاری عمومی و توصیفی، SGML و XML و زبانهای طرحواره آنها، و اصولی که نشانهگذاری قوی و قابل تبادل را از کدنویسی مبتنی بر نمایش متمایز میکند. شامل تأثیر این استانداردها بر محاسبات علوم انسانی است.
Core questions
- چه چیزی نشانهگذاری توصیفی را از نشانهگذاری رویهای و نمایشی متمایز میکند؟
- چرا علوم انسانی به SGML و سپس XML روی آوردند؟
- طرحوارهها چگونه اسناد نشانهگذاری شده را محدود و اعتبارسنجی میکنند؟
- محدودیتهای زبانهای نشانهگذاری با ساختار درختی چیست؟
Key concepts
- SGML
- XML
- نشانهگذاری توصیفی در مقابل رویهای
- طرحواره و DTD
- خوشفرم بودن و اعتبار
Key theories
- نشانهگذاری توصیفی بر رویهای
- کومبز، رنیر و دِروز استدلال کردند که نشانهگذاریای که نقش منطقی متن را نامگذاری میکند (توصیفی) برای پژوهش بر نشانهگذاریای که ظاهر را مشخص میکند (رویهای) برتری دارد، زیرا معنا را حفظ کرده و از قابلیت استفاده مجدد پشتیبانی میکند.
- کدگذاری عمومی و تفکیک دغدغهها
- جداسازی ساختار منطقی یک سند از نمایش آن، به یک منبع کدگذاری شده واحد اجازه میدهد تا تحلیل، جستجو و نمایشهای متعدد را هدایت کند، اصلی که از SGML به ارث رسیده و به XML منتقل شده است.
- مدل سند سلسلهمراتبی
- XML و پیشینیان آن اسناد را به عنوان درختان مرتب مدلسازی میکنند، که برای ساختار تو در تو قدرتمند است اما توسط ویژگیهایی که در سراسر سلسلهمراتب همپوشانی دارند، تحت فشار قرار میگیرد.
History
ایدههای کدگذاری عمومی اواخر دهه 1960 منجر به GML و سپس SGML شد که در سال 1986 استانداردسازی شد. مقاله Coombs-Renear-DeRose در سال 1987 به نفع نشانهگذاری توصیفی در پژوهش استدلال کرد. XML، یک نمایه سادهشده SGML، توسط W3C در سال 1998 منتشر شد و به سرعت مبنای TEI P5 و بیشتر رمزگذاریهای علوم انسانی قرار گرفت.
Debates
- کفایت نشانهگذاری مبتنی بر درخت
- از آنجا که XML یک سلسلهمراتب واحد را اعمال میکند، ساختارهای همپوشان رایج در متون واقعی نیازمند راهحلهای جایگزین هستند، که تحقیقات در مورد مدلهای نشانهگذاری جایگزین یا مکمل را تقویت میکند.
Key figures
- James H. Coombs
- Allen Renear
- Steven DeRose
Related topics
Seminal works
- coombs1987
- delittle1990
Frequently asked questions
- آیا XML با توجه به فرمتهای جدیدتر مانند JSON هنوز مرتبط است؟
- برای رمزگذاری علوم انسانی سندمحور، XML همچنان غالب است زیرا ساختار غنی و قابل اعتبارسنجی را بیان میکند و زیربنای TEI است. JSON و سایر فرمتها برای تبادل داده رایج هستند، اما سنت نشانهگذاری توصیفی همچنان برای نمایش متن علمی محوری است.