ScholarGate
Asisten

TEI dan Pemodelan Dokumen

Text Encoding Initiative adalah standar dominan untuk pengodean teks humaniora. Pedoman-pedoman yang ada menawarkan kosakata elemen yang luas untuk menandai segala sesuatu mulai dari baris-baris syair hingga kerusakan manuskrip, sementara pemodelan dokumen menentukan fitur-fitur mana yang akan ditangkap oleh suatu proyek dan bagaimana caranya.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Penggunaan pedoman Text Encoding Initiative untuk membuat representasi teks yang dapat dibaca mesin, bersama dengan pekerjaan analitis untuk memutuskan fitur-fitur dokumen mana yang akan dimodelkan dan bagaimana membatasi penandaan suatu proyek.

Scope

Mencakup Pedoman TEI dan penggunaannya dalam pemodelan dokumen: struktur TEI P5, header TEI dan metadata, kustomisasi melalui skema, dan praktik memutuskan apa yang akan dikodekan untuk sumber dan tujuan tertentu. Termasuk sejarah institusional Konsorsium TEI dan peran standar komunitas dalam pengodean ilmiah.

Core questions

  • Apa yang ditawarkan TEI yang tidak dimiliki oleh penandaan ad hoc?
  • Bagaimana suatu proyek menyesuaikan TEI agar sesuai dengan sumbernya tanpa mengorbankan pertukaran?
  • Fitur-fitur dokumen mana yang layak dimodelkan, dan berapa biayanya?
  • Bagaimana header TEI dan metadata mendukung penemuan dan penggunaan kembali?

Key concepts

  • Header TEI
  • Kustomisasi (ODD)
  • Set elemen
  • Validasi skema
  • Anotasi lepas

Key theories

Standar pengodean yang dikelola komunitas
TEI diatur oleh konsorsium yang memelihara kosakata yang dapat diperluas dan didokumentasikan, sehingga pilihan pengodean didasarkan pada praktik bersama daripada diciptakan kembali untuk setiap proyek.
Kustomisasi dan batasan
Karena TEI lengkap sangat besar, proyek-proyek mendefinisikan kustomisasi (skema yang dibatasi) yang memilih dan mengadaptasi elemen-elemen, menyeimbangkan cakupan ekspresif dengan konsistensi dan validasi.

History

TEI diluncurkan pada tahun 1987 oleh konsorsium asosiasi ilmiah untuk membakukan pengodean teks humaniora. Edisi-edisi awal (P1-P4) berbasis SGML; TEI P5, yang dirilis pada tahun 2007 dan terus direvisi sejak saat itu, diekspresikan dalam XML dan mendukung kustomisasi melalui kerangka kerja ODD (One Document Does it all). Standar ini sekarang mendasari berbagai edisi, korpus, dan arsip.

Debates

Kelengkapan versus kegunaan
Luasnya TEI membuatnya kuat tetapi menakutkan; perdebatan terus berlanjut mengenai seberapa banyak proyek harus menyesuaikan dan apakah subset yang lebih sederhana lebih baik melayani interoperabilitas.

Key figures

  • Lou Burnard
  • C. M. Sperberg-McQueen
  • Nancy Ide
  • Allen Renear

Related topics

Seminal works

  • tei2024
  • ide1995
  • burnard2014

Frequently asked questions

Apakah saya harus menggunakan seluruh TEI untuk menggunakan TEI?
Tidak. Proyek-proyek biasanya mendefinisikan kustomisasi yang memilih elemen-elemen yang mereka butuhkan dan membatasi bagaimana elemen-elemen tersebut digunakan. Hal ini menjaga pengodean tetap dapat dikelola dan konsisten sambil tetap kompatibel dengan standar yang lebih luas.

Methods for this concept

Related concepts