ScholarGate
Asistente

Lenguajes y Estándares de Marcado

El marcado es la capa de códigos que convierte un flujo de caracteres en un documento estructurado. La distinción entre el marcado descriptivo, que nombra lo que es una cosa, y el marcado procedimental, que indica cómo imprimirla, dio forma a los estándares — SGML, XML y sus sucesores — en los que se basa la codificación en humanidades.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

Los lenguajes formales y los estándares comunitarios — notablemente SGML y XML — utilizados para añadir códigos estructurados y legibles por máquina a los documentos, junto con los principios que hacen que dicho marcado sea descriptivo, validable e intercambiable.

Scope

Cubre los lenguajes y estándares que subyacen a la codificación de texto: la historia del marcado genérico y descriptivo, SGML y XML y sus lenguajes de esquema, y los principios que distinguen el marcado robusto e intercambiable de la codificación orientada a la presentación. Incluye la influencia de estos estándares en la informática humanística.

Core questions

  • ¿Qué distingue el marcado descriptivo del marcado procedimental y presentacional?
  • ¿Por qué las humanidades convergieron en SGML y luego en XML?
  • ¿Cómo restringen y validan los esquemas los documentos marcados?
  • ¿Cuáles son los límites de los lenguajes de marcado con estructura de árbol?

Key concepts

  • SGML
  • XML
  • Marcado descriptivo vs. procedimental
  • Esquema y DTD
  • Bien formado y validez

Key theories

Marcado descriptivo sobre procedimental
Coombs, Renear y DeRose argumentaron que el marcado que nombra el rol lógico del texto (descriptivo) es superior para la investigación académica al marcado que especifica la apariencia (procedimental), porque preserva el significado y soporta la reutilización.
Codificación genérica y separación de preocupaciones
Separar la estructura lógica de un documento de su presentación permite que una única fuente codificada impulse el análisis, la búsqueda y múltiples representaciones, un principio heredado de SGML y trasladado a XML.
Modelo de documento jerárquico
XML y sus predecesores modelan los documentos como árboles ordenados, lo cual es potente para estructuras anidadas pero se ve forzado por características que se superponen a través de la jerarquía.

History

Las ideas de codificación genérica de finales de la década de 1960 llevaron a GML y luego a SGML, estandarizado en 1986. El artículo de Coombs-Renear-DeRose de 1987 defendió el marcado descriptivo en la investigación académica. XML, un perfil simplificado de SGML, fue publicado por el W3C en 1998 y rápidamente se convirtió en la base para TEI P5 y la mayoría de la codificación en humanidades.

Debates

La adecuación del marcado basado en árboles
Dado que XML impone una única jerarquía, las estructuras superpuestas comunes en textos reales requieren soluciones alternativas, lo que impulsa la investigación de modelos de marcado alternativos o complementarios.

Key figures

  • James H. Coombs
  • Allen Renear
  • Steven DeRose

Related topics

Seminal works

  • coombs1987
  • delittle1990

Frequently asked questions

¿Sigue siendo relevante XML dados los formatos más recientes como JSON?
Para la codificación en humanidades centrada en documentos, XML sigue siendo dominante porque expresa una estructura rica y validable y subyace al TEI. JSON y otros formatos son comunes para el intercambio de datos, pero la tradición del marcado descriptivo sigue siendo central para la representación de textos académicos.

Methods for this concept

Related concepts