マークアップ言語と標準
マークアップとは、文字の羅列を構造化された文書へと変換するコードの層です。何であるかを記述する記述的マークアップと、どのように印刷するかを指示する手続き的マークアップの区別が、人文科学のエンコーディングの基盤となるSGML、XML、およびその後の標準を形成しました。
PaperMindでテーマを探す近日公開Find papers & topics
Tools & resources
Learn & explore
動画近日公開
Definition
文書に構造化された機械可読コードを追加するために使用される形式言語とコミュニティ標準(特にSGMLとXML)、およびそのようなマークアップを記述的、検証可能、交換可能にする原則。
Scope
テキストエンコーディングの基盤となる言語と標準を扱います。汎用および記述的マークアップの歴史、SGMLとXMLおよびそのスキーマ言語、そして堅牢で交換可能なマークアップをプレゼンテーション指向のコーディングと区別する原則を含みます。これらの標準が人文科学コンピューティングに与えた影響も含まれます。
Core questions
- 記述的マークアップと手続き的・表示的マークアップを区別するものは何ですか?
- なぜ人文科学はSGML、そしてXMLに収束したのですか?
- スキーマはマークアップされた文書をどのように制約し、検証しますか?
- ツリー構造のマークアップ言語の限界は何ですか?
Key concepts
- SGML
- XML
- 記述的マークアップと手続き的マークアップ
- スキーマとDTD
- 整形式性と妥当性
Key theories
- 手続き的マークアップに対する記述的マークアップの優位性
- Coombs、Renear、DeRoseは、テキストの論理的役割を命名するマークアップ(記述的)は、外観を指定するマークアップ(手続き的)よりも学術研究において優れていると主張しました。なぜなら、それは意味を保持し、再利用をサポートするからです。
- 汎用コーディングと関心の分離
- 文書の論理構造とプレゼンテーションを分離することで、単一のエンコードされたソースが分析、検索、および複数のレンダリングを駆動できるようになります。これはSGMLから受け継がれ、XMLに引き継がれた原則です。
- 階層的文書モデル
- XMLとその前身は、文書を順序付けられたツリーとしてモデル化します。これはネストされた構造には強力ですが、階層をまたがって重複する機能には無理が生じます。
History
1960年代後半の汎用コーディングのアイデアは、GML、そして1986年に標準化されたSGMLへとつながりました。1987年のCoombs-Renear-DeRoseの論文は、学術における記述的マークアップの重要性を主張しました。合理化されたSGMLプロファイルであるXMLは、1998年にW3Cによって公開され、すぐにTEI P5およびほとんどの人文科学エンコーディングの基盤となりました。
Debates
- ツリーベースのマークアップの適切性
- XMLは単一の階層を強制するため、実際のテキストによく見られる重複する構造には回避策が必要であり、代替または補完的なマークアップモデルの研究を促進しています。
Key figures
- James H. Coombs
- Allen Renear
- Steven DeRose
Related topics
Seminal works
- coombs1987
- delittle1990
Frequently asked questions
- JSONのような新しい形式がある中で、XMLはまだ関連性がありますか?
- 文書中心の人文科学エンコーディングにおいては、XMLは依然として優勢です。なぜなら、それは豊かで検証可能な構造を表現し、TEIの基盤となっているからです。JSONや他の形式はデータ交換によく使われますが、記述的マークアップの伝統は学術的なテキスト表現の中心であり続けています。