Text only | Skip links
Skip links||IT Services, University of Oxford

1. Qu'est-ce que c'est que la TEI?

  • un labyrinth trop complexe pour les humanistes?
  • un système fasciste imposant des normes informatiques à ceux qui n'en ont pas besoin?
  • un machin des bibliothécaires numérisés?
  • un bibelot inutile qui sort du TAL ?
  • une manière de gérer les trucs informatisés vraiment démodée quoi, puisqu'on a tout sur google...

2. Les enjeux de la TEI

"Text Encoding for Interchange"

  • faciliter la création, l’échange, et l’intégration des données textuelles informatisées
    • toute sorte de texte
    • toutes les langues
    • toute origine temporelle ou culturelle
  • La TEI s'adresse également ...
    • aux débutants, cherchant des solutions bien connues et consensuelles
    • aux experts, cherchant à créer de nouvelles solutions

3. Les buts de la TEI

  • faire des recommandations qui se basent sur un consensus existant
  • préférer les solutions générales à celles spécifiques à une discipline
  • en même temps permettant la spécialisation et l'extension

4. D'où est sorti la TEI?

  • Dans les années 90, c'était un projet de recherche en "digital humanities"...
    • Parainé par trois associations érudites
    • Financé 1990-1994 par NEH, EU LE Programme et SSHRC au Canada
  • Influences majeures
    • bibliothèques et archives numerisées
    • ingénierie linguistique
    • édition des sources littéraires ou historiques
  • Consortium international établi en 1999 (voir http://www.tei-c.org/)

5. Qu'est-ce que c'est que la TEI aujourd'hui?

  • Un ensemble des Guidelines (lignes directrices): peu prescriptives
  • représentant un consensus au sujet des distinctions significatives dans un vaste ensemble de matériaux textuels
  • qui s'expriment en deux gros volumes de prose et un ensemble de définitions formelles
  • ces définitions peuvent être exprimées en plusieurs langues schéma:
    • TEI P1-P3 (1991-1999) : en SGML DTD
    • TEI P4 (2000) : soit en SGML soit en XML DTD
    • TEI P5 (2005-) soit en XML DTD, en W3C Schema, ou en RelaxNG
  • derrière cet ensemble se trouve un modèle formel ("conceptual schema") de plus en plus élaboré en système de classes, voire en ontologie

et une communauté internationale active...

6. Organisation de la TEI

7. Il n'y a pas de “TEI dtd”

  • TEI est un système modulaire. On s'en sert pour créer un système d'encodage selon ses propres besoins, en sélectionnant des modules spécifiques
  • Chaque module définit un groupe d'éléments (et leurs attributs)
  • on peut sélectionner les éléments voulus, et même en changer des propriétés
  • on peut y mélanger des éléments nouveaux, ou bien natifs ou bien d'autres standards

8. L'envergure TEI

  • Structuration basique des textes continus
  • Transcription diplomatique, images, multimédia, annotations...
  • Données formelles : dates, noms de lieux ou de personnes...
  • Données paratextuelles et "meta"
  • Analyses linguistiques à tout niveau
  • Documentation de balisage
  • Et cetera: voir http://www.tei-c.org/P5/Guidelines/

... un encyclopédie du balisage

9. L'outillage TEI

Une des raisons fortes pour lesquelles se servir de la TEI est l'existence des outils TEI p.e.
roma
http://www.tei-c.org/Roma permet de construire des schémas TEI
"Garage"
services web pour conversion TEI/docx/html etc.
xaira
moteur de recherche xml
TEI publisher
systeme d'édition web
Open Text
systeme d'édition de revues.org

Une autre est la possibilite de se servir de n'importe quelle outillage XML -- parce que la TEI est 100% standard XML!

10. La boite à outils TEI-XML

Pour maîtriser les documents XML, on a besoin de les
  • créer, modifier, valider...
  • transformer, visualiser...
  • rechercher, analyser...
  • stocker, gérer, trouver ...

11. Création et modification

peut s'effectuer avec
  • un éditeur ascii classique (pe emacs)
  • un éditeur XML spécialisé (pe Oxygen)
  • un système bureautique (pe OpenOffice, Word)

Le Garage transforme entre plusieurs formats bureacratique et XML

12. Validation

  • devrait se faire en même temps que la modification
  • necessite l'existence d'un schéma
  • plusieurs utilités: jing, xmllint,onvdl, xerces...

Roma est un outil pour construire facilement des schémas TEI.

13. Transformation et visualisation

Opération fondamentale, s'appuyant sur des standards:
  • XSLT (Extensible Stylesheet Language) et XPath
  • CSS (Cascading Stylesheets)

Fonctionnement intégré dans les navigateurs, ou autres logiciels

14. Recherches et analyses

  • peuvent bien s'effectuer avec des outils de transformation
  • ou bien avec des logiciels spécialisés qui s'y appuient
  • XQuery: standard langue de requête, complémentaire de XPath
L'analyse textuelle pose des problèmes intéressants:
  • les données non-structurées
  • une richesse de métadonnées
  • des structures poly-arborescentes

XAIRA est un outil libre permettant l'indexation et recherche des corpus XML

15. Quelques exemples (1)

L'approche resistanace minimale...

16. Quelques exemples (2)

17. Des références...

Site web du Consortium TEI
http://www.tei-c.org
Depot sourceforge
http://tei.sf.net
Quelques références francophones:
  • tei-fr@lists.cru.fr
  • http://lespetitescases.net/index102/
  • http://www.culture.gouv.fr/culture/dglf/riofi/tei.htm
  • http://artist.inist.fr/article.php3?id_article=122
  • http://www.mutec-shs.fr/la-tei-en-france-pratiques-et-perspectives

(et prochainement: http://meet.tge-adonis.fr)



Lou Burnard. Date:
Copyright University of Oxford