Article body

Introduction

Les éditions électroniques se multiplient ces dernières années, la plus récente et la plus médiatique en date étant l’édition des Manuscrits de Madame Bovary, sur un site ouvert en avril 2009[1]. En effet, comme nous allons le voir, elles offrent une alternative très satisfaisante à l’édition papier pour tout texte inachevé, dont la mise en livre apparaît nécessairement le fait de choix éditoriaux plus ou moins arbitraires. Rappelons que pour qu’il y ait livre, il faut qu’il y ait assemblage d’un nombre suffisant de feuilles de papier imprimées, portant des signes destinés à être lus, constituant un tout, et se distinguant du périodique par l’absence de périodicité de sa publication[2]. La question qui se pose alors est la suivante : par le passage du livre au document numérique, s’agit-il ou non de renoncer finalement au livre? Ce dernier subit en tout cas une transformation profonde qui l’éloigne radicalement des définitions traditionnelles.

Notre réflexion sera fondée sur le travail mené par le groupe « Manuscrits de Stendhal » d’édition numérique et imprimée du fonds de manuscrits possédé par la Ville de Grenoble, dans le cadre du projet CLELIA. À l’origine de notre projet se trouvent donc les manuscrits de Stendhal conservés à la Bibliothèque municipale de Grenoble, qui ne sont pas à proprement parler des livres selon la définition du Trésor de la langue française (TLF) puisque si l’on a bien dans ce fonds des cahiers, voire des volumes reliés du vivant de Stendhal et à sa demande (comme les Mémoires sur Napoléon ou Lucien Leuwen), ce ne sont pas des documents imprimés mais écrits à la main, et ils n’étaient pas conçus comme « livres » par Stendhal lui-même. Les nombreux éditeurs de ce fonds ont produit des livres en introduisant de l’ordre dans des documents souvent éparpillés sans logique, désossés, dans les différents registres constitués et reliés par les bibliothécaires à la fin du XIXe siècle. Ils ont ainsi permis l’édition des « oeuvres complètes » de Stendhal et il faut leur rendre hommage pour l’énorme travail fourni avec beaucoup d’exigence, de rigueur et de conscience professionnelle. Mais ces décisions éditoriales se sont accompagnées de valeurs propres à leur époque, liées à la notion d’« oeuvre » et de « grand écrivain », qui ont imposé la construction d’« objets livres », là où chez Stendhal il n’existe que du texte en devenir, voire du fatras : l’esprit et la composition (ou l’absence de composition) de ces manuscrits n’ont pas réellement été respectés jusqu’à présent, et les livres produits sont donc des objets forgés et composés par les éditeurs, et non par Stendhal lui-même. Il s’agit aujourd’hui de redéfinir cette notion de « livre » de Stendhal[3], à partir de l’examen minutieux et rigoureux des manuscrits subsistants, et, pour ce faire, de réfléchir à la meilleure façon d’éditer ces manuscrits pour en faire des « livres », tout en les trahissant le moins possible[4]. L’on peut parler ici d’« editore traditore », en référence à l’expression italienne paronymique « traduttore traditore ».

Depuis octobre 2006, le groupe de travail « Manuscrits de Stendhal » s’est donc lancé dans un projet de plateforme en ligne mettant à disposition du public les images des pages des manuscrits de Stendhal (numérisées par la Bibliothèque municipale de Grenoble) accompagnées de leurs transcriptions et d’informations sur les pages et les documents auxquels elles appartiennent. La plateforme, qui sera inaugurée à l’automne 2009, permettra de concevoir et de composer des éditions imprimées complémentaires à l’édition numérique.

Au-delà de ce projet bien spécifique, nous avons été amenés à développer une réflexion théorique sur l’édition numérique et à apporter des éléments de réponses à un certain nombre de questionnements fondamentaux : en quoi un tel projet permet-il de participer à la diffusion et à la valorisation de notre patrimoine culturel? Quelle méthodologie adopter, quels outils développer quand il s’agit de concevoir deux types d’éditions complémentaires, électronique et papier? Plus spécifiquement, en ce qui concerne l’édition numérique, que nous avons souhaitée polymorphe, il a fallu se poser les questions de l’affichage, des différents types de mises à disposition des informations selon les publics, et surtout des différents modes de lecture et usages possibles induits par ces affichages et par les possibilités de restructuration dynamique des corpus.

À partir de cet exemple concret, nous développerons une analyse de ces nouvelles formes nées des possibilités inédites du numérique et proposerons les solutions méthodologiques et informatiques que nous avons mises en place. Cela nous amènera à une réflexion plus générale sur la « mémoire du livre » que permet ce type d’édition électronique.

Les possibilités de CLELIA

Le projet CLELIA est né de la collaboration entre des chercheurs littéraires et des chercheurs informaticiens linguistes[5], en vue de la valorisation scientifique du fonds Stendhal, riche de 40 000 pages environ. CLELIA est un acronyme pour « Corpus Littéraire Et Linguistique assisté par des outils d’Intelligence Artificielle ». Son objectif, outre la mise à disposition des manuscrits du fonds Stendhal pour le grand public comme la communauté scientifique, est d’allier les intérêts des disciplines littéraires et linguistiques dans la constitution d’un objet d’étude numérique. La méthodologie, les outils et les ressources informatiques sont développés dans une logique de gratuité et de mise à disposition de la communauté scientifique[6].

CLELIA se fonde sur un travail de transcription sémantique des pages de manuscrits[7]. L’objet « page de manuscrit » est transcrit dans un formalisme XML dont la grammaire a été conçue en étroite collaboration entre informaticiens et littéraires afin de la conformer à la terminologie du domaine et de la rendre accessible aux transcripteurs, quelle que soit leur aisance avec les outils informatiques.

En résulte un ensemble de fichiers XML où l’information est structurée hiérarchiquement, chaque unité textuelle de la page de manuscrit est clairement identifiée, associée aux corpus textuels lui correspondant, enrichie d’annotations critiques et génétiques. L’intérêt d’une telle représentation formelle est qu’elle peut être transformée[8] automatiquement vers des représentations visuelles ou conceptuelles.

Diversité des représentations du même objet

La granularité[9] avec laquelle l’utilisateur souhaite consulter les manuscrits détermine les modalités d’affichage. Intuitivement, la page matérielle reste un référent incontournable. Concernant les manuscrits de Stendhal, un premier type d’affichage est accessible, indépendamment de notre projet, sur le site de la Bibliothèque municipale de Grenoble (http://www.bm-grenoble.fr/patrimoine/acces-aux-collections-numerisees.htm). Ainsi, la société Arkhênum[10] met à disposition les manuscrits des six cahiers « Bérès » du Journal de Stendhal, qu’elle a numérisés sous forme de livres virtuels, la souris se substituant au doigt pour corner puis tourner la page, la présentation en Flash[11] étant agrémentée du bruit de la page que l’on tourne. Par ailleurs, elle propose une édition électronique de la Vie de Henry Brulard à partir de l’édition diplomatique de Gérald et Yvonne Rannaud chez Klincksieck, les images des manuscrits pouvant être mises en regard avec leur transcription diplomatique en mode statique[12], un moteur de recherche sommaire permettant d’effectuer des recherches simples sur le texte.

Notre appréhension du « livre » numérique est toute autre, dans l’ambition d’offrir différents regards sur les manuscrits.

Trois modes d’affichage

Parce que les numérisations ne sont qu’une composante des manuscrits de Stendhal en ligne dans le cadre du projet CLELIA, nous n’avons pas souhaité reproduire cette représentation à la fois esthétique et ludique. En revanche, voir le « livre ouvert », c’est à dire la juxtaposition d’une page paire et de la page impaire suivante est un accès aux manuscrits que nous avons préservé, sans autre agrément qu’une bulle d’information[13] permettant au lecteur d’identifier la page et les corpus littéraires auxquels elle se rattache.

Cette représentation est un moyen d’accès aux manuscrits mais rend la consultation fastidieuse sur un ensemble conséquent de pages et surtout ne permet pas l’accès à la lecture et la compréhension des pages, informations pourtant rendues disponibles par les transcriptions. Deux autres modes d’affichage remédient chacun à l’un de ces inconvénients.

D’une part, la page numérisée peut être perçue comme une photo et, subséquemment, un ensemble de pages peut être représenté comme une planche contact. À l’image de celle-ci, ou à l’image des microfilms des bibliothèques, la « vue d’ensemble » des manuscrits donne un aperçu de dix numérisations. En passant la souris sur une miniature de la numérisation d’une page, l’utilisateur accède à un ensemble d’informations complémentaires; en cliquant, il accède à la page elle-même.

D’autre part, la page peut être perçue comme un objet textuel et graphique. La numérisation, d’aussi bonne qualité soit-elle, n’en permet pas pour autant la lecture pour l’oeil peu habitué. Le troisième mode d’affichage consiste donc à mettre en regard la page numérisée et sa transcription. Pour de nombreuses raisons que nous n’énumérerons pas ici (dont celle du coût de transcription[14]), la transcription ressemble à la page d’origine, mais ne cherche pas à la reproduire exactement, de même qu’il a été choisi de ne pas associer, du moins pour le moment, des zones de l’image à des parties de la transcription.

Trois degrés de précision de l’affichage

La transcription formelle génère un ensemble d’information volumineux pour chaque page transcrite (scripteur, outil et type d’écriture, dimensions du papier, etc.). Toutefois, les chercheurs du projet CLELIA connaissent parfaitement, par l’aspect pluridisciplinaire du projet, la nécessité d’adapter le discours – le contenu informationnel – au public visé. Il en est de même pour les transcriptions. De la même façon que le lecteur curieux ne s’embarrassera pas de la lecture des notes critiques de la Pléiade, il ne doit pas voir son parcours surchargé d’informations qu’il ne saura interpréter tandis que le lecteur averti cherchera cette information.

Pour le visiteur occasionnel, nous avons choisi de limiter la surcharge d’information sur la page de manuscrit. Privilège du traitement informatique d’un ensemble documentaire structuré et formalisé, ce « nettoyage » des transcriptions est effectué automatiquement. En revanche, le lecteur averti a accès à l’ensemble des informations critiques et analytiques enregistrées par les transcripteurs pour leur affichage en ligne. Cet accès est offert aux utilisateurs qui se créent (gratuitement) un compte sur la plateforme[15].

Un troisième degré de précision d’affichage des transcriptions est celui offert aux transcripteurs. Celui-ci n’a pas pour objectif de compléter la transcription, mais de servir de support de communication entre les transcripteurs dans le processus de validation scientifique des transcriptions. Complémentairement, le transcripteur accède aux deux degrés de précision d’affichage précédemment décrits afin de s’assurer du contenu proposé aux différents publics.

Deux types de transcriptions

La transcription elle-même peut être conçue de deux manières différentes : s’agit-il de représenter la page telle qu’elle apparaît ou de représenter la résultante du processus d’écriture?

L’outil fourni aux transcripteurs leur permet de créer et, simultanément, de visualiser une transcription pseudo-diplomatique de la page. Avec cette notion de transcription pseudo-diplomatique, nous nous dissocions du concept de transcription diplomatique qui est une représentation à l’identique de la page. En nous affranchissant de certains aspects de mise en forme (orientation du texte, taille précise des caractères), nous allégeons la tâche de description de la page tout en choisissant une représentation plus lisible.

Cette représentation s’avère toutefois complexe. En effet, le texte n’est pas graphiquement linéaire : les ajouts, parfois en plusieurs fragments, se font au-dessus, au-dessous, en marge de la ligne où ils s’insèrent. La représentation pseudo-diplomatique respecte cette mise en page.

La transcription intègre les informations positionnelles, comme la position des ajouts, mais aussi logiques, c’est-à-dire dans quel ordre apparaissent les fragments ajoutés et là où ils s’insèrent dans l’énoncé. Le calcul automatique permet, dans la transcription linéarisée, de repositionner de manière logique les fragments éparpillés dans la page, de masquer les éléments biffés, les surcharges, bref, de produire un texte linéaire, résultat des différentes strates d’écriture.

Restructuration dynamique

Les pages du fonds Stendhal ont été organisées en registres non pas selon un ordre historique ou littéraire, mais selon un ordre matériel : le format des pages et cahiers. Ce désordre est corrigé virtuellement par CLELIA en reconstituant les ensembles de pages dépendant des mêmes corpus littéraires.

Toutefois, au-delà de ce désordre dû à l’organisation matérielle, la pratique scripturale de Stendhal intègre un désordre au sein même des pages : des notes d’ordre diariste se mêlant des notes de lecture ou des essais théâtraux ou littéraires. Il est donc nécessaire de s’affranchir de la page matérielle et de se concentrer sur les fragments textuels des pages afin de reconstituer des objets littéraires et, notamment, d’en « faire des livres ».

La description fine des manuscrits dans un langage formel est le préalable nécessaire à l’automatisation de cette tâche. Selon le principe d’héritage du langage XML, repris du principe d’héritage des propriétés dans l’arbre de Porphyre et des catégories aristotéliciennes, chaque fragment hérite des propriétés du fragment qui le contient sauf si des propriétés contradictoires sont déclarées. Ainsi, une ligne héritera des propriétés « scripteur » et « outil d’écriture » du paragraphe qui la contient, sauf s’il est stipulé que la ligne a été rédigée par une autre main ou avec un autre outil que ceux du paragraphe.

La granularité « page » peut alors être ignorée, tous les constituants de la page héritent des propriétés de celle-ci[16]. Le fonds de manuscrit peut alors être perçu non plus comme un ensemble matériel de pages, mais comme un ensemble d’unités textuelles et graphiques, imbriquées (mais pas enchevêtrées) les unes dans les autres, chacune étant enrichie de propriétés permettant de la catégoriser selon plusieurs axes.

Le texte peut alors être rematérialisé : il s’agit de sélectionner les unités textuelles en fonction de certaines propriétés (par exemple, la propriété « corpus : journal », ou « scripteur : Crozet ») et de les réordonner selon d’autres critères (date et lieu de rédaction). Là encore, l’outil informatique peut répondre à ces besoins de lectures rhizomatiques des manuscrits. Mais le défi aussi bien technique qu’éditorial est de fournir non pas un ensemble de textes restructurés, mais un outil permettant de construire à l’envi les textes restructurés selon les attentes du lecteur. L’outil de « restructuration dynamique » est au stade des tests de laboratoire (le suivi du projet peut se faire sur le Wiki de travail de l’équipe) et sera mis à la disposition du public sur la plateforme CLELIA (http://manuscrits-de-stendhal.org) d’ici la fin 2009.

L’outil informatique n’est toutefois pas miraculeux. En exceptant le fait que des erreurs aient pu s’immiscer dans les transcriptions – la procédure de validation étant là pour parer à tous ces risques – les textes reconstruits peuvent ne pas être des textes finalisés : la réorganisation des ajouts peut résulter en une structure phrastique incohérente; la restructuration dynamique n’est que le résultat d’une requête formulée par un utilisateur et les unités ainsi réorganisées peuvent ne pas constituer un ensemble cohérent. L’outil informatique n’est là que pour faciliter la tâche et requiert le regard critique du lecteur – voire de l’éditeur pour qui l’outil est une aide à l’édition et non un outil d’édition. Un traitement manuel s’imposera donc.

Hypermédiatisation du texte

Pour favoriser la dimension conviviale aussi bien que scientifique du site, il est prévu à court terme d’intégrer des hyperliens vers d’autres textes (de Stendhal ou d’autres auteurs), vers des documents audiovisuels, vers d’autres sites, etc. Toutes ces fonctionnalités rendent possible – et même souhaitable – une lecture non linéaire des textes : il s’agit de donner accès à différents types de lecture, qui ne correspondent plus à la lecture traditionnelle. On voit aussi disparaître la notion d’annexes, puisqu’elles s’imbriquent dans le texte de Stendhal lui-même, mais si et seulement si l’utilisateur le souhaite (principe des hyperliens sur lesquels il faut cliquer et des bulles d’information qui s’ouvrent si l’on passe la souris dessus)[17]. L’édition électronique rendue possible par CLELIA vise ainsi à obtenir la plus grande fidélité à l’objet manuscrit, à son organisation, à ses propriétés physiques, et non aux « livres » qui en ont été tirés par les éditeurs, et qui sont le plus souvent des inventions. Mais s’agit-il pour autant de renoncer au livre?

Quelle mémoire du livre?

Disparition du concept traditionnel de « livre »

Certes, avec l’édition numérique, on assiste clairement à la disparition du livre traditionnel, évidemment comme objet (par le passage de trois dimensions à deux, et la disparition du support papier) mais aussi et surtout comme contenu formel unique, ayant un début et une fin, et des séquences organisées selon un ordre unique. Or, comme le rappelle Alain Giffard :

La séquentialité [imposée par le livre papier] présente un double défaut : elle correspond mal au mouvement de la pensée, elle impose à tous les lecteurs une seule et même manière de parcourir le texte. Au lieu de multiplier les écritures et les présentations, l’hypertexte proposera différentes versions du même texte activées par différents parcours en fonction des stratégies des lecteurs[18].

L’hypertexte ainsi constitué s’approche en ce sens du fantasme borgésien de la bibliothèque de Babel par sa dimension labyrinthique[19].

Changement du statut et du rôle du lecteur

Ce changement de l’objet induit aussi un changement du statut et des parcours du lecteur. Certes, il est possible d’avoir une lecture non linéaire d’un livre imprimé, par exemple en le commençant par la fin, en le feuilletant, ou en y accédant par un index ou une table des matières, ou en effectuant un va-et-vient entre le texte et les notes critiques éventuellement présentes en fin de volume[20]. Mais l’édition électronique démultiplie ces possibilités de lecture rhizomatique, et les rend plus faciles d’accès. Avec CLELIA en particulier, le lecteur devient réellement un acteur essentiel dans un processus de lecture interactive. Il peut en effet décider de son parcours dans le fonds des manuscrits : il circule au sein des pages en choisissant à tout moment de sa lecture l’orientation qu’il veut prendre.

Il peut ainsi se constituer des portefolios personnalisés et créer ainsi lui-même un nouveau « livre électronique » à partir d’une sélection subjective de pages de manuscrits. Les pages du site lui donnent par ailleurs la possibilité de suivre des parcours guidés automatisés (il a ainsi le loisir de consulter toutes les pages de manuscrits sur lesquels figurent des dessins), proposés par des chercheurs, ou même par d’autres lecteurs (les « portefolios » personnels pouvant être proposés aux autres utilisateurs).

De façon plus générale, CLELIA a été conçu dans le souci constant d’exploiter l’atout incontestable du numérique dans la diffusion du savoir à un public élargi et diversifié. L’édition électronique permet en effet de remettre en question la notion de publics différenciés : une édition savante, dans la tradition du livre, ne s’adresse pas au grand public; inversement une édition de poche sans annotations critiques ne concerne pas les spécialistes du domaine. Ainsi, dans le domaine de l’édition papier, les publics sont-ils de façon générale bien distincts.

Inversement, CLELIA permettant de superposer les niveaux d’utilisateurs du même objet, on assiste à une réconciliation des différents publics : chercheurs, étudiants, professeurs et élèves du secondaire, amateurs éclairés ou même simples curieux peuvent finalement se retrouver sur les mêmes pages, voire sur les mêmes parcours, sans avoir les mêmes attentes, et en étant attentifs à des éléments d’information différents sur la même page : le lecteur amateur sera sans doute plus sensible à l’intérêt « esthétique » de visualiser les étapes de la genèse par une animation conviviale, alors que le chercheur en génétique des textes, ou simplement spécialiste de Stendhal, sera attentif à la connaissance que nous apporte cet outil à propos des techniques d’écriture de cet écrivain. Ainsi, a contrario des éditions papiers différenciées, le lecteur a une liberté de perception du même objet qu'est la page, selon l'intérêt qu'il souhaite y porter.

À partir de l’analyse des pratiques des « lecteurs », des images, transcriptions et enrichissements de pages de Stendhal mis en ligne seront proposés, ensuite de nouveaux outils de lecture, conçus par les informaticiens linguistes de l’équipe, qui observent et analysent les parcours des utilisateurs sur le site. En ce sens, si livre électronique il y a, c’est un livre inachevé, en perpétuel devenir, et dans la rédaction duquel interviennent, à des niveaux différents, plusieurs auteurs de compétences et statuts différents.

Trahison du livre? concurrence avec le livre?

Il convient aussi de réfléchir sur les notions de visible et de lisible : comme le font remarquer Almuth Gresillon[21], et Alain Rey[22], on ne lit pas réellement une page de manuscrit, on ne peut que se contenter de la regarder, à l’inverse d’une page de livre. CLELIA, en ce sens, a pour objectif de rendre le visible lisible grâce aux transcriptions, tout en conservant à la page manuscrite sa dimension d’objet à voir. Loin d’aboutir à une destruction pernicieuse, la plateforme réinvente ainsi d’une certaine façon la notion de livre, en permettant à chaque lecteur de se constituer son propre livre, ou plutôt ses propres livres à partir des manuscrits de Stendhal. D’autre part, plutôt que de tuer le livre imprimé, l’édition électronique que nous proposons apparaît comme une réaffirmation de la nécessaire coexistence entre les deux types d’éditions, et ce, grâce aux possibilités d’édition à la demande, et au souci affirmé de complémentarité.

Les Journaux et papiers de Stendhal constituent à ce titre un bon exemple. En effet, les littéraires du groupe « Manuscrits de Stendhal » se sont lancés dans la transcription de tous les documents susceptibles de se rattacher à ce corpus mouvant et complexe aux marges entre plusieurs genres littéraires. Les fiches ainsi constituées seront progressivement mises en ligne pour constituer une véritable édition électronique des Journaux et papiers. Mais l’objectif est aussi de se servir des fichiers XML comme base pour une nouvelle édition imprimée des Journaux et papiers aux ELLUG. Chaque médium a sa spécificité : convivialité, hypertextualité, liberté de parcours et possibilité de recherches originales pour l’édition électronique; construction d’un nouvel « objet livre » au sens traditionnel, dont le contenu aura été renouvelé par le passage par la base documentaire et la redéfinition des corpus. Ce livre imprimé proposera, à l’inverse de l’édition électronique, des annotations critiques (sur le contenu) et explicatives (sur le manuscrit et l’établissement du texte), répondant aux exigences scientifiques formulées par les chercheurs littéraires de l’équipe.

Conclusion

Ainsi, l’édition électronique de manuscrits littéraires permet la création de nouveaux objets, fondés sur de nouvelles pratiques éditoriales et induisant de nouveaux modes de lecture.

Nathalie Ferrand s’interrogeait en 1997 : « la question à l’époque du texte électronique, du texte “dé-livré” (Jan Herman[23]) est de savoir si les nouvelles formes de la textualité peuvent nous permettre de comprendre le texte autrement [24] ». En 2009, avec l’édition électronique des manuscrits de Stendhal, les pages peuvent indifféremment se dé-textualiser ou se re-textualiser, se dé-livrer ou se re-livrer. Et le jeu de miroirs entre ces différentes formes de livres réinventés permet certainement de lire les manuscrits autrement.