ScholarGate
دستیار

زبان‌ها و استانداردهای نشانه‌گذاری

نشانه‌گذاری لایه‌ای از کدها است که جریانی از کاراکترها را به یک سند ساختاریافته تبدیل می‌کند. تمایز بین نشانه‌گذاری توصیفی، که ماهیت یک چیز را نام‌گذاری می‌کند، و نشانه‌گذاری رویه‌ای، که نحوه چاپ آن را بیان می‌کند، استانداردهایی — SGML، XML و جانشینان آنها — را شکل داده است که رمزگذاری علوم انسانی بر آن استوار است.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

زبان‌های رسمی و استانداردهای جامعه — به ویژه SGML و XML — که برای افزودن کدهای ساختاریافته و قابل خواندن توسط ماشین به اسناد استفاده می‌شوند، همراه با اصولی که چنین نشانه‌گذاری را توصیفی، قابل اعتبارسنجی و قابل تبادل می‌سازد.

Scope

زبان‌ها و استانداردهایی را پوشش می‌دهد که زیربنای رمزگذاری متن هستند: تاریخچه نشانه‌گذاری عمومی و توصیفی، SGML و XML و زبان‌های طرح‌واره آنها، و اصولی که نشانه‌گذاری قوی و قابل تبادل را از کدنویسی مبتنی بر نمایش متمایز می‌کند. شامل تأثیر این استانداردها بر محاسبات علوم انسانی است.

Core questions

  • چه چیزی نشانه‌گذاری توصیفی را از نشانه‌گذاری رویه‌ای و نمایشی متمایز می‌کند؟
  • چرا علوم انسانی به SGML و سپس XML روی آوردند؟
  • طرح‌واره‌ها چگونه اسناد نشانه‌گذاری شده را محدود و اعتبارسنجی می‌کنند؟
  • محدودیت‌های زبان‌های نشانه‌گذاری با ساختار درختی چیست؟

Key concepts

  • SGML
  • XML
  • نشانه‌گذاری توصیفی در مقابل رویه‌ای
  • طرح‌واره و DTD
  • خوش‌فرم بودن و اعتبار

Key theories

نشانه‌گذاری توصیفی بر رویه‌ای
کومبز، رنیر و دِروز استدلال کردند که نشانه‌گذاری‌ای که نقش منطقی متن را نام‌گذاری می‌کند (توصیفی) برای پژوهش بر نشانه‌گذاری‌ای که ظاهر را مشخص می‌کند (رویه‌ای) برتری دارد، زیرا معنا را حفظ کرده و از قابلیت استفاده مجدد پشتیبانی می‌کند.
کدگذاری عمومی و تفکیک دغدغه‌ها
جداسازی ساختار منطقی یک سند از نمایش آن، به یک منبع کدگذاری شده واحد اجازه می‌دهد تا تحلیل، جستجو و نمایش‌های متعدد را هدایت کند، اصلی که از SGML به ارث رسیده و به XML منتقل شده است.
مدل سند سلسله‌مراتبی
XML و پیشینیان آن اسناد را به عنوان درختان مرتب مدل‌سازی می‌کنند، که برای ساختار تو در تو قدرتمند است اما توسط ویژگی‌هایی که در سراسر سلسله‌مراتب همپوشانی دارند، تحت فشار قرار می‌گیرد.

History

ایده‌های کدگذاری عمومی اواخر دهه 1960 منجر به GML و سپس SGML شد که در سال 1986 استانداردسازی شد. مقاله Coombs-Renear-DeRose در سال 1987 به نفع نشانه‌گذاری توصیفی در پژوهش استدلال کرد. XML، یک نمایه ساده‌شده SGML، توسط W3C در سال 1998 منتشر شد و به سرعت مبنای TEI P5 و بیشتر رمزگذاری‌های علوم انسانی قرار گرفت.

Debates

کفایت نشانه‌گذاری مبتنی بر درخت
از آنجا که XML یک سلسله‌مراتب واحد را اعمال می‌کند، ساختارهای همپوشان رایج در متون واقعی نیازمند راه‌حل‌های جایگزین هستند، که تحقیقات در مورد مدل‌های نشانه‌گذاری جایگزین یا مکمل را تقویت می‌کند.

Key figures

  • James H. Coombs
  • Allen Renear
  • Steven DeRose

Related topics

Seminal works

  • coombs1987
  • delittle1990

Frequently asked questions

آیا XML با توجه به فرمت‌های جدیدتر مانند JSON هنوز مرتبط است؟
برای رمزگذاری علوم انسانی سندمحور، XML همچنان غالب است زیرا ساختار غنی و قابل اعتبارسنجی را بیان می‌کند و زیربنای TEI است. JSON و سایر فرمت‌ها برای تبادل داده رایج هستند، اما سنت نشانه‌گذاری توصیفی همچنان برای نمایش متن علمی محوری است.

Methods for this concept

Related concepts