Text only | Skip links
Skip links||IT Services, University of Oxford

Après avoir travaillé sur l’en-tête TEI, on va mettre en œuvre certaines des possibilités offertes par TEI pour transcrire un texte manuscrit.

Si vous êtes content/e avec le document que vous avez créé dans l'exercice précédent, vous pouvez bien sûr continuer à travailler sur cela. Ou bien, ouvrez avec Oxygen le fichier TP2-0.xml, dans le dossier Abbadie ou acteRoyal selon l’équipe dans laquelle vous vous trouvez. Ce fichier contient déjà le minimum d’informations pour ne pas partir de zéro, en particulier quelques données dans l’en-tête TEI, et dans l’élément <text>, dans <body>, un élément <div> dans lequel vous allez pouvoir saisir la transcription.

Comme lorsqu’on réalise une édition critique classique, le travail de transcription fidèle est la première étape concrète dans le processus d’édition électronique d’un document. Il est ensuite possible, bien sûr, d’ajouter des couches d’annotation, d’indexation, d’interprétation.

Avant de se lancer, qu’on travaille directement en XML/TEI ou qu’on passe par une version au traitement de texte, il faut bien sûr avoir compris ce document, son sens, le processus d’écriture. Pour vous aider (vous pourrez ainsi procéder par copier/coller), nous mettons à votre disposition la transcription établie par plusieurs historiens chercheurs (pour l’acte royal, voyez le fichier page1.txt ; pour le récit de voyage, voyez les fichiers original.txt et revised.txt, qui donnent d’une part le texte initial - la lettre contenant le récit de voyage -, d’autre part le texte après les modifications qui en ont été faites pour le transformer en document administratif). Enfin, il existe des règles communément admises pour l’édition des textes anciens, en ce qui concerne la ponctuation, l’emploi des majuscules, les graphies. Les fichiers *.txt fournis en tiennent compte.

On aimerait bien que vous essayiez, pour chacun des textes, d’encoder ces transcriptions initiales.

Concrètement il existe plusieurs manières de faire ; mais avant de vous lancer, il faudra au moins vous poser certaines questions :
  • quelle est la structure logique du texte tel que vous en prenez connaissance sur son support ? quelles grandes sections peut-on y distinguer ? bien sûr, cette structure est liée au type de document. Le résultat de cette analyse vous permettra de composer, ou de former au fur et à mesure (à vous de voir, il n’y a pas une méthode unique) une ossature XML pour y faire ensuite entrer votre transcription
  • pour entrer un peu plus dans le détail, comment s’est déroulé le processus d’écriture ? pour les deux documents, plusieurs personnes sont intervenues successivement. En TEI on parle de mains, il faudra déclarer ces mains dans l’en-tête TEI, en donnant à chacun des éléments correspondants un identifiant, pour pouvoir ensuite utiliser l’attribut hand ou l’élément <handShift> dans la transcription. Dans chacune des grandes sections, vous pourrez ensuite voir comment distinguer et articuler entre elles les interventions successives.
  • plus encore dans le détail, il faudra identifier les éléments dont vous allez avoir besoin pour structurer ce que vous allez copier/coller. Cela revient à déterminer ce que vous voulez isoler comme segments de texte, en fonction de votre point de vue, de vos objectifs en terme d’exploitation du document et d’affichage ; une fois cette liste dressée, il faudra trouver dans la TEI comment les objets retenus sont dénommés.
  • pensez aussi à la mise en page du texte. Il ne s’agit pas forcément de faire une édition imitative, mais noter par exemple les changements de page, éventuellement les changements de ligne, ou l’emplacement relatif des ajouts, peut avoir un intérêt en soi, sans compter que cela peut s’avérer utile, notamment pour restituer ensuite adéquatement le fichier TEI en HTML ou autre format de sortie.
  • si vous avez un peu de temps, on aimerait bien que vous essayiez d’annoter le texte en vous servant des notes historiques préparées pour vous dans les fichiers dont le nom contient *notes. Il s’agira d’utiliser l’élément <note> ; pour ce qui est de l’indexation et de la création de notices d’autorité, on verra cela pendant le 3e TP.
  • On pourrait aussi établir un lien entre la page transcrite et l’image numérique.

D’autres problèmes se poseront forcément...

Bonne réflexion ! et à votre disposition pour discuter.

Quand vous aurez fini, n'oubliez pas de vérifier que le document reste conforme au schéma tei_mut! Et n'oubliez pas de le sauvegarder sur votre clé...



Florence Clavaud (École nationale des chartes). Date: juin et septembre 2010
Copyright University of Oxford