TEI与文档建模
文本编码倡议(Text Encoding Initiative, TEI)是人文文本编码的主导标准。其指南提供了丰富的词汇,用于标记从诗行到手稿损坏的一切内容,而文档建模则决定了特定项目将捕获哪些特征以及如何捕获。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
使用文本编码倡议指南创建文本的机器可读表示,以及决定建模哪些文档特征以及如何约束项目标记的分析工作。
Scope
涵盖TEI指南及其在文档建模中的应用:TEI P5的结构、TEI头和元数据、通过模式进行定制,以及决定为给定来源和目的编码哪些内容的实践。包括TEI联盟的机构历史和社区标准在学术编码中的作用。
Core questions
- TEI提供了哪些临时标记所不具备的功能?
- 项目如何定制TEI以适应其来源,同时又不牺牲互换性?
- 文档的哪些特征值得建模,代价是什么?
- TEI头和元数据如何支持发现和重用?
Key concepts
- TEI头
- 定制(ODD)
- 元素集
- 模式验证
- 分离式标注
Key theories
- 社区维护的编码标准
- TEI由一个联盟管理,该联盟维护一个可扩展的、有文档记录的词汇表,因此编码选择基于共享实践,而不是为每个项目重新发明。
- 定制与约束
- 由于完整的TEI非常庞大,项目会定义一个定制(受约束的模式),选择和调整元素,在表达覆盖范围与一致性和验证之间取得平衡。
History
TEI于1987年由一个学术协会联盟发起,旨在标准化人文文本编码。早期版本(P1-P4)基于SGML;TEI P5于2007年发布并持续修订,以XML表示,并通过ODD(One Document Does it all)框架支持定制。该标准现在是广泛版本、语料库和档案的基础。
Debates
- 全面性与可用性
- TEI的广度使其功能强大但令人生畏;关于项目应定制多少以及更简单的子集是否能更好地服务互操作性的争论仍在继续。
Key figures
- Lou Burnard
- C. M. Sperberg-McQueen
- Nancy Ide
- Allen Renear
Related topics
Seminal works
- tei2024
- ide1995
- burnard2014
Frequently asked questions
- 我必须使用整个TEI才能使用TEI吗?
- 不必。项目通常会定义一个定制,选择他们需要的元素并约束它们的使用方式。这使得编码易于管理和保持一致,同时仍与更广泛的标准兼容。