TEI et modélisation de documents
La Text Encoding Initiative (TEI) est la norme dominante pour l'encodage des textes en sciences humaines. Ses directives offrent un vaste vocabulaire d'éléments permettant de baliser tout, des vers aux dommages manuscrits, tandis que la modélisation de documents détermine quelles caractéristiques un projet donné capturera et comment.
Definition
L'utilisation des directives de la Text Encoding Initiative pour créer des représentations de textes lisibles par machine, ainsi que le travail analytique consistant à décider quelles caractéristiques du document modéliser et comment contraindre le balisage d'un projet.
Scope
Couvre les directives de la TEI et leur utilisation dans la modélisation de documents : la structure de la TEI P5, l'en-tête et les métadonnées de la TEI, la personnalisation via des schémas, et la pratique consistant à décider quoi encoder pour une source et un objectif donnés. Inclut l'histoire institutionnelle du Consortium TEI et le rôle des normes communautaires dans l'encodage savant.
Core questions
- Qu'est-ce que la TEI offre que le balisage ad hoc n'offre pas ?
- Comment un projet personnalise-t-il la TEI pour l'adapter à ses sources sans sacrifier l'interopérabilité ?
- Quelles caractéristiques d'un document valent la peine d'être modélisées, et à quel coût ?
- Comment l'en-tête et les métadonnées de la TEI soutiennent-ils la découverte et la réutilisation ?
Key concepts
- En-tête TEI
- Personnalisation (ODD)
- Jeu d'éléments
- Validation de schéma
- Annotation en déport
Key theories
- Norme d'encodage maintenue par la communauté
- La TEI est régie par un consortium qui maintient un vocabulaire extensible et documenté, de sorte que les choix d'encodage sont fondés sur une pratique partagée plutôt que réinventés pour chaque projet.
- Personnalisation et contrainte
- Étant donné que la TEI complète est très vaste, les projets définissent une personnalisation (un schéma contraint) qui sélectionne et adapte les éléments, équilibrant la couverture expressive avec la cohérence et la validation.
History
La TEI a été lancée en 1987 par un consortium d'associations savantes afin de standardiser l'encodage des textes en sciences humaines. Les premières éditions (P1-P4) étaient basées sur SGML ; la TEI P5, publiée en 2007 et révisée continuellement depuis, est exprimée en XML et prend en charge la personnalisation via le cadre ODD (One Document Does it all). La norme sous-tend désormais un large éventail d'éditions, de corpus et d'archives.
Debates
- Exhaustivité versus convivialité
- L'étendue de la TEI la rend puissante mais intimidante ; le débat se poursuit sur la mesure dans laquelle les projets devraient la personnaliser et si des sous-ensembles plus simples serviraient mieux l'interopérabilité.
Key figures
- Lou Burnard
- C. M. Sperberg-McQueen
- Nancy Ide
- Allen Renear
Related topics
Seminal works
- tei2024
- ide1995
- burnard2014
Frequently asked questions
- Dois-je utiliser l'intégralité de la TEI pour l'employer ?
- Non. Les projets définissent généralement une personnalisation qui sélectionne les éléments dont ils ont besoin et contraint leur utilisation. Cela permet de maintenir l'encodage gérable et cohérent tout en restant compatible avec la norme plus large.