TEI와 문서 모델링
텍스트 인코딩 이니셔티브(Text Encoding Initiative, TEI)는 인문학 텍스트 인코딩을 위한 지배적인 표준입니다. 이 지침은 시의 행부터 원고 손상에 이르기까지 모든 것을 마크업하기 위한 방대한 요소 어휘를 제공하며, 문서 모델링은 주어진 프로젝트가 어떤 기능을 어떤 방식으로 캡처할지 결정합니다.
PaperMind(으)로 주제 찾기곧 제공Find papers & topics
Tools & resources
Learn & explore
동영상곧 제공
Definition
텍스트 인코딩 이니셔티브 지침을 사용하여 텍스트의 기계 판독 가능한 표현을 생성하는 것과, 어떤 문서 기능을 모델링하고 프로젝트의 마크업을 어떻게 제약할지 결정하는 분석 작업을 함께 의미합니다.
Scope
TEI 지침과 문서 모델링에서의 사용법을 다룹니다: TEI P5의 구조, TEI 헤더 및 메타데이터, 스키마를 통한 사용자 정의, 그리고 주어진 소스와 목적에 대해 무엇을 인코딩할지 결정하는 실제 관행. TEI 컨소시엄의 기관 역사와 학술 인코딩에서 커뮤니티 표준의 역할을 포함합니다.
Core questions
- TEI가 임시 마크업이 제공하지 않는 것은 무엇입니까?
- 프로젝트는 상호 교환성을 희생하지 않고 TEI를 소스에 맞게 어떻게 사용자 정의합니까?
- 문서의 어떤 기능이 모델링할 가치가 있으며, 그 비용은 얼마입니까?
- TEI 헤더와 메타데이터는 발견 및 재사용을 어떻게 지원합니까?
Key concepts
- TEI 헤더
- 사용자 정의(ODD)
- 요소 집합
- 스키마 유효성 검사
- 스탠드오프 주석
Key theories
- 커뮤니티 유지 인코딩 표준
- TEI는 확장 가능하고 문서화된 어휘를 유지하는 컨소시엄에 의해 관리되므로, 인코딩 선택은 모든 프로젝트마다 재발명되는 것이 아니라 공유된 관행에 기반을 둡니다.
- 사용자 정의 및 제약
- 전체 TEI는 매우 방대하기 때문에, 프로젝트는 요소들을 선택하고 조정하는 사용자 정의(제약된 스키마)를 정의하여 표현 범위와 일관성 및 유효성 검사 사이의 균형을 맞춥니다.
History
TEI는 인문학 텍스트 인코딩을 표준화하기 위해 학술 협회 컨소시엄에 의해 1987년에 시작되었습니다. 초기 버전(P1-P4)은 SGML 기반이었으며, 2007년에 출시되어 이후 지속적으로 개정된 TEI P5는 XML로 표현되며 ODD(One Document Does it all) 프레임워크를 통해 사용자 정의를 지원합니다. 이 표준은 현재 광범위한 판본, 코퍼스 및 아카이브의 기반이 되고 있습니다.
Debates
- 포괄성과 유용성
- TEI의 광범위함은 강력하지만 부담스럽습니다. 프로젝트가 얼마나 사용자 정의해야 하는지, 그리고 더 간단한 하위 집합이 상호 운용성에 더 잘 기여하는지에 대한 논쟁이 계속되고 있습니다.
Key figures
- Lou Burnard
- C. M. Sperberg-McQueen
- Nancy Ide
- Allen Renear
Related topics
Seminal works
- tei2024
- ide1995
- burnard2014
Frequently asked questions
- TEI를 사용하려면 TEI 전체를 사용해야 합니까?
- 아닙니다. 프로젝트는 일반적으로 필요한 요소를 선택하고 사용 방법을 제약하는 사용자 정의를 정의합니다. 이는 인코딩을 관리 가능하고 일관성 있게 유지하면서 더 넓은 표준과 호환되도록 합니다.