Siêu dữ liệu và Từ vựng có kiểm soát
Siêu dữ liệu là dữ liệu về dữ liệu: các mô tả có cấu trúc cho phép các đối tượng kỹ thuật số được tìm thấy, hiểu, quản lý và kết nối. Các từ vựng có kiểm soát và tệp thẩm quyền cung cấp cho các mô tả đó một ngôn ngữ chung, không mơ hồ để các tài nguyên trong các bộ sưu tập có thể được liên kết.
Definition
Các mô tả có cấu trúc của tài nguyên kỹ thuật số, cùng với các từ vựng và hệ thống thẩm quyền được tiêu chuẩn hóa được sử dụng để làm cho các mô tả đó nhất quán, có khả năng tương tác và có thể liên kết giữa các bộ sưu tập.
Scope
Bao gồm siêu dữ liệu mô tả, cấu trúc và quản trị trong lĩnh vực nhân văn; các tiêu chuẩn như Dublin Core; các tệp thẩm quyền và từ vựng có kiểm soát; và Web ngữ nghĩa (Semantic Web) cùng dữ liệu mở liên kết (linked open data) như một cách để kết nối các tài nguyên văn hóa. Bao gồm cách siêu dữ liệu hỗ trợ khám phá, khả năng tương tác và quản lý lâu dài.
Core questions
- Một tài nguyên văn hóa cần những loại siêu dữ liệu nào để được tìm thấy và hiểu?
- Các từ vựng có kiểm soát làm giảm sự mơ hồ và cho phép liên kết như thế nào?
- Các tiêu chuẩn như Dublin Core hỗ trợ khả năng tương tác như thế nào?
- Việc xuất bản dữ liệu nhân văn dưới dạng dữ liệu mở liên kết có ý nghĩa gì?
Key concepts
- Siêu dữ liệu mô tả
- Dublin Core
- Tệp thẩm quyền
- Từ vựng có kiểm soát
- Dữ liệu mở liên kết
- Định danh bền vững
Key theories
- Các loại và chức năng của siêu dữ liệu
- Siêu dữ liệu thường được chia thành các loại mô tả, cấu trúc và quản trị, mỗi loại phục vụ việc khám phá, điều hướng hoặc quản lý các đối tượng kỹ thuật số.
- Khả năng tương tác thông qua các tiêu chuẩn
- Các lược đồ chung như Dublin Core cung cấp một từ vựng tối thiểu chung để các tài nguyên từ các hệ thống khác nhau có thể được tổng hợp và tìm kiếm cùng nhau.
- Dữ liệu liên kết và Web ngữ nghĩa
- Việc thể hiện siêu dữ liệu dưới dạng các câu lệnh có thể đọc được bằng máy với các định danh ổn định cho phép các tài nguyên văn hóa được kết nối thành một mạng lưới dữ liệu thay vì các bản ghi riêng lẻ.
History
Các truyền thống lập danh mục thư viện đã thiết lập các từ vựng có kiểm soát và kiểm soát thẩm quyền từ rất lâu trước khi có máy tính. Sáng kiến Dublin Core vào giữa những năm 1990 đã cung cấp một tiêu chuẩn siêu dữ liệu đơn giản, đa lĩnh vực; sự trình bày của Web ngữ nghĩa vào năm 2001 và thực tiễn dữ liệu liên kết sau đó đã mở rộng những ý tưởng này hướng tới dữ liệu di sản văn hóa được kết nối với nhau.
Debates
- Sự đơn giản so với khả năng biểu đạt
- Các tiêu chuẩn tối thiểu như Dublin Core tối đa hóa khả năng tương tác nhưng có thể quá thô sơ cho mô tả học thuật phong phú, trong khi các lược đồ chi tiết có nguy cơ phân mảnh từ vựng chung.
Key figures
- Anne J. Gilliland
- Murtha Baca
- Tim Berners-Lee
Related topics
Seminal works
- gilliland2016
- weibel1998
- berners2001
Frequently asked questions
- Tại sao nên sử dụng từ vựng có kiểm soát thay vì thẻ văn bản tự do?
- Các thuật ngữ văn bản tự do khác nhau về chính tả, ngôn ngữ và mức độ cụ thể, điều này làm phân tán các mục liên quan. Một từ vựng có kiểm soát hoặc tệp thẩm quyền cố định các thuật ngữ ưu tiên và liên kết các biến thể, do đó các tìm kiếm truy xuất mọi thứ về một khái niệm hoặc một người bất kể cách nó được diễn đạt ban đầu.