TEI und Dokumentenmodellierung
Die Text Encoding Initiative ist der dominierende Standard für die Kodierung von Texten in den Geisteswissenschaften. Ihre Richtlinien bieten ein umfangreiches Vokabular an Elementen zur Auszeichnung von allem, von Verszeilen bis hin zu Manuskriptschäden, während die Dokumentenmodellierung entscheidet, welche dieser Merkmale ein bestimmtes Projekt erfassen wird und wie.
Definition
Die Anwendung der Richtlinien der Text Encoding Initiative zur Erstellung maschinenlesbarer Repräsentationen von Texten, zusammen mit der analytischen Arbeit, zu entscheiden, welche Dokumentmerkmale modelliert werden sollen und wie die Auszeichnung eines Projekts eingeschränkt werden soll.
Scope
Umfasst die TEI-Richtlinien und ihre Verwendung bei der Modellierung von Dokumenten: die Struktur von TEI P5, den TEI-Header und Metadaten, die Anpassung durch Schemata und die Praxis, zu entscheiden, was für eine gegebene Quelle und einen bestimmten Zweck kodiert werden soll. Beinhaltet die institutionelle Geschichte des TEI-Konsortiums und die Rolle von Gemeinschaftsstandards bei der wissenschaftlichen Kodierung.
Core questions
- Was bietet die TEI, was Ad-hoc-Auszeichnungen nicht bieten?
- Wie passt ein Projekt die TEI an seine Quellen an, ohne die Austauschbarkeit zu opfern?
- Welche Merkmale eines Dokuments sind es wert, modelliert zu werden, und zu welchem Preis?
- Wie unterstützen der TEI-Header und Metadaten die Auffindbarkeit und Wiederverwendung?
Key concepts
- TEI-Header
- Anpassung (ODD)
- Element-Set
- Schema-Validierung
- Standoff-Annotation
Key theories
- Gemeinschaftlich gepflegter Kodierungsstandard
- Die TEI wird von einem Konsortium verwaltet, das ein erweiterbares, dokumentiertes Vokabular pflegt, sodass Kodierungsentscheidungen auf einer gemeinsamen Praxis basieren und nicht für jedes Projekt neu erfunden werden.
- Anpassung und Einschränkung
- Da die vollständige TEI sehr umfangreich ist, definieren Projekte eine Anpassung (ein eingeschränktes Schema), die Elemente auswählt und anpasst, um eine ausgewogene Abdeckung der Ausdrucksmöglichkeiten mit Konsistenz und Validierung zu gewährleisten.
History
Die TEI wurde 1987 von einem Konsortium wissenschaftlicher Vereinigungen ins Leben gerufen, um die Textkodierung in den Geisteswissenschaften zu standardisieren. Frühe Editionen (P1-P4) basierten auf SGML; TEI P5, 2007 veröffentlicht und seitdem kontinuierlich überarbeitet, ist in XML ausgedrückt und unterstützt die Anpassung durch das ODD-Framework (One Document Does it all). Der Standard liegt heute einer Vielzahl von Editionen, Korpora und Archiven zugrunde.
Debates
- Umfassendheit versus Benutzerfreundlichkeit
- Die Breite der TEI macht sie mächtig, aber auch einschüchternd; es wird weiterhin darüber diskutiert, wie stark Projekte anpassen sollten und ob einfachere Untergruppen die Interoperabilität besser fördern.
Key figures
- Lou Burnard
- C. M. Sperberg-McQueen
- Nancy Ide
- Allen Renear
Related topics
Seminal works
- tei2024
- ide1995
- burnard2014
Frequently asked questions
- Muss ich die gesamte TEI verwenden, um die TEI zu nutzen?
- Nein. Projekte definieren normalerweise eine Anpassung, die die benötigten Elemente auswählt und deren Verwendung einschränkt. Dies hält die Kodierung überschaubar und konsistent, während sie mit dem breiteren Standard kompatibel bleibt.