Метаданные и контролируемые словари
Метаданные — это данные о данных: структурированные описания, которые позволяют находить, понимать, управлять и связывать цифровые объекты. Контролируемые словари и авторитетные файлы обеспечивают этим описаниям общий, однозначный язык, чтобы ресурсы из разных коллекций могли быть связаны.
Definition
Структурированные описания цифровых ресурсов, а также стандартизированные словари и авторитетные системы, используемые для обеспечения согласованности, интероперабельности и связываемости этих описаний между коллекциями.
Scope
Охватывает дескриптивные, структурные и административные метаданные в гуманитарных науках; стандарты, такие как Dublin Core; авторитетные файлы и контролируемые словари; а также Семантическую паутину и связанные открытые данные как способ соединения культурных ресурсов. Включает описание того, как метаданные поддерживают обнаружение, интероперабельность и долгосрочное управление.
Core questions
- Какие виды метаданных необходимы культурному ресурсу, чтобы его можно было найти и понять?
- Как контролируемые словари уменьшают неоднозначность и обеспечивают связывание?
- Как стандарты, такие как Dublin Core, поддерживают интероперабельность?
- Что значит публиковать гуманитарные данные как связанные открытые данные?
Key concepts
- Дескриптивные метаданные
- Dublin Core
- Авторитетный файл
- Контролируемый словарь
- Связанные открытые данные
- Постоянный идентификатор
Key theories
- Типы и функции метаданных
- Метаданные традиционно делятся на дескриптивные, структурные и административные категории, каждая из которых служит для обнаружения, навигации или управления цифровыми объектами.
- Интероперабельность через стандарты
- Общие схемы, такие как Dublin Core, предоставляют общий минимальный словарь, чтобы ресурсы из разных систем могли быть агрегированы и совместно искались.
- Связанные данные и Семантическая паутина
- Выражение метаданных в виде машиночитаемых утверждений со стабильными идентификаторами позволяет связывать культурные ресурсы в сеть данных, а не в изолированные записи.
History
Традиции библиотечной каталогизации установили контролируемые словари и авторитетный контроль задолго до появления компьютеров. Инициатива Dublin Core в середине 1990-х годов предоставила простой кросс-доменный стандарт метаданных; формулировка Семантической паутины в 2001 году и последующая практика связанных данных расширили эти идеи в направлении взаимосвязанных данных культурного наследия.
Debates
- Простота против выразительности
- Минимальные стандарты, такие как Dublin Core, максимизируют интероперабельность, но могут быть слишком грубыми для богатого научного описания, в то время как детализированные схемы рискуют фрагментировать общий словарь.
Key figures
- Anne J. Gilliland
- Murtha Baca
- Tim Berners-Lee
Related topics
Seminal works
- gilliland2016
- weibel1998
- berners2001
Frequently asked questions
- Почему следует использовать контролируемый словарь вместо тегов свободного текста?
- Термины свободного текста различаются по написанию, языку и специфичности, что рассеивает связанные элементы. Контролируемый словарь или авторитетный файл фиксирует предпочтительные термины и связывает варианты, поэтому поиск извлекает все, что относится к концепции или человеку, независимо от того, как это было первоначально сформулировано.