ScholarGate
Asistan

İşaretleme Dilleri ve Standartları

İşaretleme (markup), bir karakter akışını yapılandırılmış bir belgeye dönüştüren kod katmanıdır. Bir şeyin ne olduğunu adlandıran tanımlayıcı işaretleme (descriptive markup) ile onu nasıl yazdırılacağını belirten prosedürel işaretleme (procedural markup) arasındaki ayrım, beşeri bilimler kodlamasının temelini oluşturan SGML, XML ve bunların ardılları gibi standartları şekillendirmiştir.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Belgelere yapılandırılmış, makine tarafından okunabilir kodlar eklemek için kullanılan resmi diller ve topluluk standartları — özellikle SGML ve XML — ile bu işaretlemeyi tanımlayıcı, doğrulanabilir ve değiştirilebilir kılan ilkeler bütünüdür.

Kapsam

Metin kodlamasının temelini oluşturan dilleri ve standartları kapsar: genel ve tanımlayıcı işaretlemenin tarihi, SGML ve XML ile şema dilleri ve sağlam, değiştirilebilir işaretlemeyi sunum odaklı kodlamadan ayıran ilkeler. Bu standartların beşeri bilimler bilişimi üzerindeki etkisi de bu kapsamda incelenmektedir.

Temel sorular

  • Tanımlayıcı işaretlemeyi prosedürel ve sunumsal işaretlemeden ayıran nedir?
  • Beşeri bilimler neden önce SGML'ye, sonra XML'ye yönelmiştir?
  • Şemalar, işaretlenmiş belgeleri nasıl kısıtlar ve doğrular?
  • Ağaç yapılı işaretleme dillerinin sınırları nelerdir?

Anahtar kavramlar

  • SGML
  • XML
  • Tanımlayıcı ve prosedürel işaretleme
  • Şema ve DTD
  • İyi biçimlilik ve geçerlilik

Temel kuramlar

Prosedürel işaretlemeye karşı tanımlayıcı işaretleme
Coombs, Renear ve DeRose, metnin mantıksal rolünü adlandıran (tanımlayıcı) işaretlemenin, görünümü belirten (prosedürel) işaretlemeye göre akademik çalışmalar için daha üstün olduğunu savunmuşlardır; çünkü bu yaklaşım anlamı korur ve yeniden kullanımı destekler.
Genel kodlama ve sorumlulukların ayrılması
Bir belgenin mantıksal yapısını sunumundan ayırmak, tek bir kodlanmış kaynağın analiz, arama ve birden çok görselleştirme için kullanılmasını sağlar; bu, SGML'den miras alınan ve XML'e aktarılan bir ilkedir.
Hiyerarşik belge modeli
XML ve öncülleri, belgeleri sıralı ağaçlar olarak modeller; bu, iç içe geçmiş yapılar için güçlü olmakla birlikte, hiyerarşi boyunca çakışan özellikler nedeniyle zorlanmaktadır.

Tarihçe

1960'ların sonlarındaki genel kodlama fikirleri GML'ye ve ardından 1986'da standartlaştırılan SGML'ye yol açmıştır. 1987 tarihli Coombs-Renear-DeRose makalesi, akademik çalışmalarda tanımlayıcı işaretlemenin önemini ortaya koymuştur. SGML'nin basitleştirilmiş bir profili olan XML, 1998'de W3C tarafından yayımlanmış ve hızla TEI P5 ile çoğu beşeri bilimler kodlamasının temelini oluşturmuştur.

Tartışmalar

Ağaç tabanlı işaretlemenin yeterliliği
XML tek bir hiyerarşiyi dayattığı için, gerçek metinlerde yaygın olan çakışan yapılar geçici çözümler gerektirmekte, bu da alternatif veya tamamlayıcı işaretleme modelleri üzerine araştırmaları teşvik etmektedir.

Öne çıkan isimler

  • James H. Coombs
  • Allen Renear
  • Steven DeRose

İlgili konular

Temel eserler

  • coombs1987
  • delittle1990

Sıkça sorulan sorular

JSON gibi daha yeni formatlar göz önüne alındığında XML hala geçerli midir?
Belge merkezli beşeri bilimler kodlaması için XML baskınlığını korumaktadır, çünkü zengin, doğrulanabilir bir yapı ifade eder ve TEI'nin temelini oluşturur. JSON ve diğer formatlar veri alışverişi için yaygın olsa da, tanımlayıcı işaretleme geleneği akademik metin temsilinde hala merkezi bir role sahiptir.

Bu kavram için yöntemler

İlgili kavramlar