TEI และการสร้างแบบจำลองเอกสาร
Text Encoding Initiative (TEI) เป็นมาตรฐานหลักสำหรับการเข้ารหัสข้อความในสาขามนุษยศาสตร์ แนวทางของ TEI นำเสนอชุดคำศัพท์ที่กว้างขวางสำหรับกำกับการทำเครื่องหมายทุกสิ่ง ตั้งแต่บรรทัดของบทกวีไปจนถึงความเสียหายของต้นฉบับ ในขณะที่การสร้างแบบจำลองเอกสารจะตัดสินใจว่าโครงการที่กำหนดจะบันทึกคุณลักษณะใดบ้างและอย่างไร
Definition
การใช้แนวทางของ Text Encoding Initiative เพื่อสร้างการแสดงข้อความที่เครื่องอ่านได้ ควบคู่ไปกับงานวิเคราะห์ในการตัดสินใจว่าจะสร้างแบบจำลองคุณลักษณะของเอกสารใดบ้าง และจะจำกัดการทำเครื่องหมายของโครงการอย่างไร
Scope
ครอบคลุมแนวทางของ TEI และการใช้งานในการสร้างแบบจำลองเอกสาร: โครงสร้างของ TEI P5, ส่วนหัวและข้อมูลเมตาของ TEI, การปรับแต่งผ่านสคีมา, และแนวปฏิบัติในการตัดสินใจว่าจะเข้ารหัสอะไรสำหรับแหล่งที่มาและวัตถุประสงค์ที่กำหนด รวมถึงประวัติสถาบันของ TEI Consortium และบทบาทของมาตรฐานชุมชนในการเข้ารหัสทางวิชาการ
Core questions
- TEI มีอะไรที่การทำเครื่องหมายเฉพาะกิจไม่มี?
- โครงการจะปรับแต่ง TEI ให้เข้ากับแหล่งข้อมูลได้อย่างไรโดยไม่สูญเสียความสามารถในการแลกเปลี่ยนข้อมูล?
- คุณลักษณะใดของเอกสารที่ควรค่าแก่การสร้างแบบจำลอง และมีค่าใช้จ่ายเท่าใด?
- ส่วนหัวและข้อมูลเมตาของ TEI สนับสนุนการค้นพบและการนำกลับมาใช้ใหม่ได้อย่างไร?
Key concepts
- ส่วนหัว TEI
- การปรับแต่ง (ODD)
- ชุดองค์ประกอบ
- การตรวจสอบสคีมา
- คำอธิบายประกอบแบบ Standoff
Key theories
- มาตรฐานการเข้ารหัสที่ดูแลโดยชุมชน
- TEI อยู่ภายใต้การกำกับดูแลของกลุ่มสมาคมที่ดูแลชุดคำศัพท์ที่ขยายได้และมีเอกสารประกอบ เพื่อให้การเลือกการเข้ารหัสเป็นไปตามแนวปฏิบัติร่วมกัน แทนที่จะสร้างขึ้นใหม่สำหรับทุกโครงการ
- การปรับแต่งและการจำกัด
- เนื่องจาก TEI ฉบับเต็มมีขนาดใหญ่มาก โครงการต่างๆ จึงกำหนดการปรับแต่ง (สคีมาที่จำกัด) ที่เลือกและปรับองค์ประกอบต่างๆ โดยรักษาสมดุลระหว่างความครอบคลุมที่แสดงออกได้กับความสอดคล้องและการตรวจสอบความถูกต้อง
History
TEI ก่อตั้งขึ้นในปี 1987 โดยกลุ่มสมาคมวิชาการเพื่อสร้างมาตรฐานการเข้ารหัสข้อความในสาขามนุษยศาสตร์ ฉบับแรกๆ (P1-P4) ใช้ SGML; TEI P5 ซึ่งเผยแพร่ในปี 2007 และได้รับการปรับปรุงอย่างต่อเนื่องตั้งแต่นั้นมา แสดงในรูปแบบ XML และรองรับการปรับแต่งผ่านกรอบงาน ODD (One Document Does it all) ปัจจุบันมาตรฐานนี้เป็นพื้นฐานของฉบับพิมพ์ คลังข้อมูล และเอกสารสำคัญที่หลากหลาย
Debates
- ความครอบคลุมเทียบกับความสามารถในการใช้งาน
- ความกว้างขวางของ TEI ทำให้มีประสิทธิภาพแต่ก็เป็นเรื่องที่น่ากังวล การถกเถียงยังคงดำเนินต่อไปว่าโครงการต่างๆ ควรปรับแต่งมากน้อยเพียงใด และชุดย่อยที่เรียบง่ายกว่าจะให้บริการการทำงานร่วมกันได้ดีกว่าหรือไม่
Key figures
- Lou Burnard
- C. M. Sperberg-McQueen
- Nancy Ide
- Allen Renear
Related topics
Seminal works
- tei2024
- ide1995
- burnard2014
Frequently asked questions
- ฉันจำเป็นต้องใช้ TEI ทั้งหมดเพื่อที่จะใช้ TEI หรือไม่?
- ไม่ โครงการต่างๆ มักจะกำหนดการปรับแต่งที่เลือกองค์ประกอบที่ต้องการและจำกัดวิธีการใช้งาน ซึ่งช่วยให้การเข้ารหัสสามารถจัดการได้และสอดคล้องกัน ในขณะที่ยังคงเข้ากันได้กับมาตรฐานที่กว้างขึ้น