元数据与受控词表
元数据是关于数据的数据:它是一种结构化描述,使数字对象能够被发现、理解、管理和连接。受控词表和规范文档为这些描述提供了一种共享的、无歧义的语言,从而使不同馆藏的资源能够相互关联。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
数字资源的结构化描述,以及用于使这些描述在不同馆藏中保持一致、可互操作和可链接的标准化词表和规范系统。
Scope
涵盖人文领域的描述性、结构性和管理性元数据;都柏林核心元数据(Dublin Core)等标准;规范文档和受控词表;以及作为连接文化资源方式的语义网和关联开放数据。包括元数据如何支持发现、互操作性和长期管理。
Core questions
- 文化资源需要哪些元数据才能被发现和理解?
- 受控词表如何减少歧义并实现关联?
- 都柏林核心元数据(Dublin Core)等标准如何支持互操作性?
- 将人文数据作为关联开放数据发布意味着什么?
Key concepts
- 描述性元数据
- 都柏林核心元数据(Dublin Core)
- 规范文档
- 受控词表
- 关联开放数据
- 持久标识符
Key theories
- 元数据的类型和功能
- 元数据通常分为描述性、结构性和管理性三类,每类都服务于数字对象的发现、导航或管理。
- 通过标准实现互操作性
- 都柏林核心元数据(Dublin Core)等共享模式提供了一个通用的最小词汇表,以便来自不同系统的资源可以聚合在一起并进行联合检索。
- 关联数据与语义网
- 将元数据表示为具有稳定标识符的机器可读语句,可以将文化资源连接到数据网络中,而不是孤立的记录。
History
早在计算机出现之前,图书馆编目传统就建立了受控词表和规范控制。20世纪90年代中期的都柏林核心元数据(Dublin Core)倡议提供了一个简单的跨领域元数据标准;2001年语义网的阐述以及随后的关联数据实践将这些思想扩展到互联的文化遗产数据。
Debates
- 简洁性与表达力
- 都柏林核心元数据(Dublin Core)等最小标准最大限度地提高了互操作性,但对于丰富的学术描述可能过于粗略,而详细的模式则有碎片化共享词汇表的风险。
Key figures
- Anne J. Gilliland
- Murtha Baca
- Tim Berners-Lee
Related topics
Seminal works
- gilliland2016
- weibel1998
- berners2001
Frequently asked questions
- 为什么使用受控词表而不是自由文本标签?
- 自由文本术语在拼写、语言和特异性方面存在差异,这会分散相关项目。受控词表或规范文档确定了首选术语并关联了变体,因此无论原始措辞如何,搜索都能检索到关于某个概念或人物的所有信息。