Du papier à l’écran : les Humanités et l’édition électronique

Les Nouvelles technologies au service de la conservation des documents sont prometteuses. Elles permettent une conservation plus ou moins pérenne des textes, mais aussi une démocratisation de ceux-ci et de leur contenu sans toucher aux supports originaux : parchemins, livres, etc. Bien entendu, le texte numérique ne permettra jamais de remplacer la rapport quasi charnel qu’entretient l’homme avec le papier.

Actuellement, il existe en France plusieurs projets d’éditions électronique de textes anciens. Que ce soit un ouvrage de littérature comme l’Astrée d’Honoré d’Urfé qui marqua durablement toute l’aristocratie française jusqu’au XVIIIe siècle par les thèmes abordés par ce roman pastoral, que ce soit l’édition intégrale des oeuvres de Bossuet, de ses joutes théologiques avec le pasteur Ferry, de Metz, à l’Histoire des variations du protestantisme , la numérisation promet de diffuser plus largement ces oeuvres.

On peut distinguer deux sortes d’édition électronique : la numérisation pure et simple d’un document, et l’édition numérique. Pour la numérisation, voyons deux exemples :

  • La Bibliothèque nationale permet grâce à Gallica de retrouver plus d’1 millions de textes numérisés. La version du site actuellement en place est, je trouve, moins pratique et ergonomique que la précédente. Elle avait aussi l’avantage de ne pas faire mal aux yeux, avec son joli fond mauve. Cependant, on accède librement à l’intégralité de ces textes, généralement libres de droit donc accessibles au plus grand nombre.
  • Google Livres permet aussi de retrouver ces textes numérisés avec des accès plus restreints, car Google peut numériser des fonds de bibliothèques sous certaines conditions. En France, Google doit notamment respecter le droit d’auteur. On trouve ainsi des références sur telle ou telle édition de Mauriac, par exemple, mais on ne peut pas toujours avoir accès au texte numérisé. L’avantage de Google Livres est le mode recherche dans le texte, qui permet d’aller directement au mot désiré. Sur Gallica, ce mode n’est pas toujours actif.

L’édition numérique s’inscrit dans cette démarche de numérisation, mais va plus loin. Il ne s’agit pas seulement de numériser des documents , il s’agit  aussi d’exploiter la masse d’informations qui y est contenue, de la rendre à la fois lisible et visible.

L’édition numérique s’inscrit pleinement dans le cadre des digital humanities : les sciences humaines et sociales numériques. Les digital humanities constituent un ensemble de méthodes de travail, métiers, pratiques, compétences des personnels des organismes de recherche et d’enseignement supérieur qui sont au contact de l’informatisation des données, et de l’édition électronique, etc. Ces méthodes sont avant tout des outils de travail permettant de faire avancée la recherche.  Les digital humanities se basent sur des outils informatiques « ouverts » c’est-à-dire des outils libres de droit ou en libre accès. Pour l’édition numérique, la grande majorité des projets se base sur le langage XML  langage informatique plus puissant que le HTML puisqu’il permet de créer ses propres balises. l’encodage XML suit les recommandations de la TEI (Text Encoding Initiative) La TEI est un consortium d’acteurs issus de milieux universitaires ou de la recherche en sciences humaines et sociales et linguistique. Créée en 1987, elle a pour but de proposer des normes d’encodage en XML. (un exemple de lignes de textes encodés ici). Les textes transcrits en XML sont ensuite mis en forme selon des feuillets CSS.

Prenons un exemple : le projet Artamène. Artamène ou le Grand Cyrus, écrit par des époux Scudéry est le plus long roman de la langue française avec 13 095 pages dans l’édition originale, publiée entre 1649 et 1653. Une coopération helvéto-américaine a permis de numériser intégralement ce roman, d’en donner une version électronique sous plusieurs formes.

On a donc plusieurs présentations possibles du texte : soit un texte en mode continu c’est-à-dire ne respectant pas la pagination initiale, soit le texte paginé selon l’édition originale avec une image de la page de l’édition d’origine :

 

 

Un résumé de chaque partie et à l’intérieur de chaque chapitre est également disponible, de même qu’un outil fort pratique d’agrandissement de police. Le tout est imprimable. Un moteur de recherche permet de localiser un ou plusieurs termes dans le texte.

L’intégralité du texte et des documents sont libres de droit, à condition de citer la source.

D’autres éditions proposent aussi une version régularisée en corrigeant, par exemple des fautes de typographie, ou  « corrigée » avec une orthographe moderne.

Pour une version corrigée, les Bibliothèques virtuelles humanistes met à disposition ce type de travail critique. Ce projet, développé par le CESR (Centre d’Etudes Supérieurs de la Renaissance) de l’université de Tours depuis 2002 numérise et diffuse les livres anciens et documents patrimoniaux en rapport avec les activités du CESR. On trouve sur le site des BVH des fac-similés, c’est-à-dire des ouvrages numérisées, une base textuelle, Epistemon qui propose l’édition d’ouvrages en format XML-TEI  :

Les mots corrigés sont en rouge. En plaçant son pointeur dessus, une fenêtre s’affiche et mentionne la correction opérée sur le mot. On voit aussi sur cet exemple que l’édition numérique s’efforce de respecter au maximum la mise en page de l’édition originale, jusqu’aux marques d’imprimeur.

Pour des projets véritablement historique avec un appareil critique, on peut consulter l’édition en ligne des édits de pacification précédant l’Edit de Nantes, dirigée par Bernard Barbiche et hébergée par l’Ecole nationale des Chartes.

Bien entendu, ces projets sont à but non lucratif puisqu’élaborés par des organismes universitaires et/ou de recherche à partir de logiciels libres, de formats ouverts. Ces éditions permettent de valoriser et de diffuser le travail de recherche effectué par ces chercheurs, ces enseignants, ces informaticiens, et on aurait tort de s’en priver… Les possibilités offertes par les nouvelles technologies dans le cadre des digital humanities sont donc prometteuses pour tout chercheur, enseignant. La France est en retard par rapport à d’autres pays comme le Royaume-Uni et les Etats-Unis. Tous ces projets nécessitent cependant une réelle implication de tous les acteurs, l’élaboration d’une politique numérique par les établissements en solo ou en collaborations ainsi que des financements pour les équipements et la formation. Hélas, pour les universités françaises, la LRU et l’autonomie financière conduit souvent à ne pas budgetiser correctement beaucoup de projets développés par leurs laboratoires.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s