Approche critique de l'outil traitement de textes

 

L'objet de cette page est de démontrer de manière claire et précise pourquoi le traitement de textes ne devrait pas jouir d'une position dominante dans le domaine bureautique. Les critiques portées à l'encontre de cette technologie ne doivent pas être mal interprétées. Si j'en viens presque à dire que le traitement de textes est un outil stupide, il ne faut pas comprendre par là que les utilisateurs de ces logiciels sont stupides (sauf si après avoir lu cette page, ils continuent à les utiliser). La chose à remettre en cause est le choix technologique fait par les créateurs de traitements de textes. Ce choix c'est généralisé jusqu'à devenir un standard de fait. Il existe pourtant d'autres choix, mais ceux-ci ne possèdent pas de qualité permettant de faire la promotion d'un logiciel telle qu'on la conçoit actuellement.

Critique de l'outil traitement de textes

Il me semble nécessaire de faire part de cette critique alors même que la plupart des nouveaux utilisateurs de systèmes de type Unix libres confondent traitement et composition de textes. Le passage d'un système propriétaire à un autre totalement ouvert est l'occasion rêvée de remettre en cause les solutions que l'on croyait uniques... Ces critiques ont déjà été faites par plusieurs centaines de personnes à travers le monde -- ne vous étonnez donc pas de retrouver les mêmes arguments dans d'autres critiques.

Avant de commencer, revenons rapidement à la nature même d'un texte afin de bien définir la situation. Un texte a pour but de permettre la communication d'une personne à une autre. Il existe deux manières d'envisager cette communication. La première se matérialise par le document imprimé : il s'agit de la forme traditionnelle. La seconde forme, plus récente, est la communication électronique comme l'e-mail, les pages Web, etc. Ces deux formes de communication se rejoignent souvent dans la réalité. En effet, il est fréquent d'imprimer ses e-mails ou encore, de placer sur un site Web des informations recopiées d'un manuel.

Création d'un document

Partons du fait que vous tapiez un document sur votre ordinateur. Celui-ci devrait apparaître de ma meilleure manière possible sur votre imprimante. Bien sûr, vous ne voulez pas que le texte apparaisse directement sur l'imprimante. Après tout, vous avez acheté un ordinateur et non une machine à écrire. Ce que vous voulez, c'est saisir le document en question et l'enregistrer sous forme électronique sur le médium de votre choix (disque, disquette, etc). Plus tard, vous voudrez reprendre ce document pour y apporter quelques corrections pour enfin l'imprimer. Les leaders du marché des traitements de textes qualifient leurs logiciels comme étant la manière naturelle de procéder. En fait, il s'agit là, d'une méthode, mais assurément pas la plus naturelle.

Lorsque vous créez un document, vous devez diviser votre travail en deux étapes. Dans un premier temps, vous vous intéressez aux informations contenues dans le texte pour, ensuite, vous pencher sur la manière la plus efficace de présenter ces informations. En pratique ceci peut s'analyser comme suit :

Phase 1 : l'utilisateur s'intéresse « au fond ». Il choisit la manière de présenter ses idées sous forme d'informations distinctes. Dans le même temps, il structure ces informations de manière logique. Tout ceci prend, peu à peu, la forme de chapitres, sections, sous-sections et paragraphes.

Phase 2 : l'utilisateur se penche ensuite sur la manière de présenter la structure de son document. Il n'est plus question à ce moment de prendre en compte les informations qui forment le texte, mais uniquement son organisation. L'utilisateur décore le document à l'aide de puces, de retraits, de capitales, etc.

Dans un premier temps, il se concentre sur l'objet du texte pour ensuite l'oublier et s'attacher à la forme qu'il donne au texte. On parle alors de saisie au kilomètre et, ensuite, de mise en forme.

Les écrivains n'ont pas à faire cet exercice : ils ne s'intéressent qu'à l'objet de leur récit. Parfois, il en va de même pour les ouvrages techniques. Une ou plusieurs autres personnes s'occuperont de mettre en forme leur texte. Il n'en va pas de même pour vous, en particulier si vous êtes étudiant, programmeur ou traducteur dans le monde du logiciel libre. Vous devez vous atteler aux deux tâches car vous êtres à la fois l'auteur et le typographe.

Les traitements de textes

Avec les logiciels comme MS Word, Corel Wordperfect et les autres logiciels inclus dans des suites bureautique, les deux travaux de base sont réunis en une seule et même étape. Ces logiciels se basent sur un standard technologique auto-proclamé : le WYSIWYG (What You See Is What You Get -- Ce que vous voyez est ce que vous imprimez).
Cette technologie fournit à l'utilisateur la possibilité de voir apparaître les données typographiques sur le document en cours d'élaboration. Notons au passage que pour des raisons variées, il arrive souvent que le document à l'écran soit très différent de la sortie imprimante.

Les problèmes qui se posent alors sont multiples :

Ce dernier point est d'ailleurs la chose la plus important dans la création d'un document.
Avec un formateur de textes, vous pouvez structurer un texte à l'aide de mots simples. Ainsi, lorsque vous décidez de créer une nouvelle section, vous utilisez une commande (ou macro) comme \section{voici ma section}. Vous ne vous intéressez alors qu'à la structure du texte et non à la manière de présenter visuellement cette structure.
Avec un traitement de textes WYSIWYG, le texte que vous tapez vous apparaît dans son ensemble. Il vous est alors nécessaire de décider, tout de suite, la manière dont vous allez présenter cette structure. En pensant à la logique de votre texte, vous entrez déjà dans le domaine de la typographie. Exemple : vous tapes le titre d'une section, vous le sélectionnez, choisissez son apparence et voilà...
Mais comment savoir s'il s'agit d'une section, d'un chapitre, ou encore d'une simple manière d'attirer l'attention du lecteur ? Tant que le document n'est pas entièrement terminé, aucune information ne permet de comprendre sa structure logique. Il arrive même qu'au moment de la saisie, des erreurs d'organisation se glissent pour cette raison.
Convaincu ? Si votre réponse est non, imaginez que vous repreniez un document et que vous désiriez apporter des modifications dans sa présentation. Combien de fois allez-vous effectuer les mêmes opérations sur plusieurs parties différentes de texte qui sont pourtant de nature identique (comme un titre de chapitre par exemple) ?
Bien sûr, les éditeurs de traitement de textes ont apporté une solution à ce dernier problème. Cette solution est l'approche feuille de style, qui permet de définir des références entre la structure et la typographie. Peu de personnes utilisent une telle fonctionnalité dans la pratique. L'approche WYSIWYG elle-même ne l'encourage guère. De plus, en respectant la division le fond et la forme, vous êtres obligé de faire référence à la structure du texte dans la saisie au kilomètre à l'aide de mots quelconques.

L'édition de texte

Lorsqu'on parle d'éditeur de textes, on fait référence à des logiciels permettant la saisie de caractères alphabétiques. Les notions typographiques et de mise en page n'entrent pas en ligne de compte. Le but premier est de permettre l'accumulation et la sauvegarde de texte brut.
Pour bien faire la comparaison entre éditeur de textes et traitement de textes, il suffit de comparer les fichiers enregistrés. Dans le premier logiciel, seul le texte lui-même est enregistré sous la forme de valeurs binaires correspondants aux caractères ASCII. En examinant un fichier provenant d'un traitement de textes, on constate qu'un grosse partie de son contenu est dédié aux informations typographiques (dans le meilleur des cas, car il a souvent été vu des sauvegardes des différents nivaux d'annulation de frappe dans les documents MS Word). Le contenu d'un tel fichier n'est lisible qu'avec le traitement de textes l'ayant généré, ou au mieux, avec une version compatible d'un autre logiciel. Cet état de fait apporte un certain nombre d'inconvénients :

L'autre solution

Tout au début de cette page, j'ai fait référence aux différents logiciels qui composent (c'est le cas de le dire) l'alternative aux traitements de textes par des mots comme borne, formateurs de textes ou encore macros. Le but de cette page n'est pas d'être une introduction aux formateurs de texte. Je n'entrerai donc pas dans des considérations trop spécifiques ou techniques.
La notion de traitement de textes s'efforce de réunir les deux phases de la création d'un document. Les formateurs de textes font exactement l'inverse. Rappelez-vous ce qui est dit plus haut : en saisie au kilomètre, il faudrait mettre des mots informant sur la structure logique du document. C'est exactement ce que fait un formateur de textes, sauf que, dans ce cas, c'est le formateur lui-même qui remplacera ces mots par une mise en forme typographique correspondante.
Ainsi, dans le cas d'une documentation technique concernant un logiciel, une thèse, un livre, un article, vous définissez son aspect typographique à part. Et ce, uniquement si aucun de ceux déjà existant ne vous conviennent. Lors de la saisie du texte, vous n'aurez qu'à penser au fond en organisant votre prose à l'aide de mots clés simples et clairs.
Le formateur le plus utilisé est, bien sûr, TeX. Plusieurs modules s'ajoutent à celui-ci, comme LaTeX, ou les macros TeXinfo officiellement adoptées comme le format de documents GNU.

Cette manière de procéder sépare bien la création du texte, à partir des informations à décrire, de l'aspect esthétique du document final. Le document reste aisément modifiable. Il est lisible avec n'importe quel éditeur de textes et les modifications typographiques se font sur l'ensemble du document.
Comprenez bien que l'ensemble des problèmes soulevés plus haut disparaît purement et simplement. Les fichiers sont légers, lisibles, portables et adaptables. Débarrassé de la contrainte de rapidité propre aux interfaces utilisateur WYSIWYG, le formateur de texte peut, enfin, miser sur la qualité finale et non sur les temps de réponse (et autres plus historiques).
TeX et ses modules (en fait il s'agit de macros) sont gratuits et surtout libres. TeX a été créé en 1977 par Donald Knuth, de l'université de Standford. En 1990, son développement a été arrêté car il n'y avait tout simplement plus de fonctions à ajouter, ni de bogues à supprimer.
LaTeX, pour sa part, est l'oeuvre de Leslie Lamport. Depuis 1980, un groupe de développeurs internationaux travaillent sur l'ajout de fonctionnalités, comme la création de fichiers PDF (Portable Document Format). Leur travail n'est pas de finir le développement de LaTeX, mais de lui faire suivre l'évolution du monde.

Considérations techniques et typographiques

Perspective typographique

Lorsque l'on considère le texte comme un produit fini, imprimé sur le papier, on constate que le travail effectué par l'imprimeur au sens large (maquettiste, typographe...) aboutit à créer, sur une surface blanche, une ou plusieurs zones rectangulaires, colorées en noir d'intensité variable (selon la police, la graisse adoptée...).

Notion de gris typographique

Ces zones imprimées contribuent à fonder la notion de gris typographique. Elles sont et peuvent être caractérisée géométriquement par leur position physique sur la page et la quantité de blanc qui sert de frontière entre les blocs. Elles instaurent une géographie de la page imprimée. D'une manière qui peut sembler quelque peu paradoxale au néophyte, c'est donc le blanc (et non l'écrit) qui instaure l'imprimé en texte. Cette formalisation permet alors de décrire la page, puis un ensemble de pages (du plus simple -- prospectus, carte de visite, article, lettre... -- au plus complexe -- roman, encyclopédie, manuel...), à partir d'un certain nombre de mesures de distances (marge haute, basse, indentation des paragraphes, police et attributs).
On peut raffiner la description en accordant à chaque bloc une intensité de couleur (du blanc ou du noir). Cette intensité est liée à des caractéristiques physiques de la police utilisée (dessin des caractères, graisse..) et à l'interlignage (l'accroissement de l'espacement entre les lignes diminue l'impression d'intensité du noir).
Il faut remarquer que la notion de gris typographique est une notion visuelle, sensorielle, qui est perçue par le lecteur quasiment avant la lecture proprement dite : cette notion ne fait aucunement appel ni au contenu, ni au sens du texte. Elle permet cependant de caractériser, de manière fine, nombre d'imprimés : pour s'en convaincre, il suffit, en superposant une feuille de calque sur un imprimé, de tracer les limites des différents rectangles et de les colorier en gris plus ou moins intenses. Le dessin obtenu permet, dans un grand nombre de cas, de reconnaître le type d'écrit (journal, revue, livre...) et même d'avancer le titre de la publication (faites l'expérience avec deux magazines présentant les programmes télévisés).
Cette perspective descriptive de la géographique de la page imprimée est à la base d'un certain nombre d'outils logiciels de publication assisté (comme Publisher, Page Maker, Quark XPress...) qui exigent, de manière plus ou moins stricte, que l'utilisateur de l'outil définisse d'abord les différentes zones avant de pouvoir y incorporer du texte (ou de l'image). Cette perspective peut aussi servir de fondement pour l'analyse des outils plus classiques de traitement de textes : on n'utilisera, pour cela, que les deux exemples classiques d'outils respectivement de traitement de textes et de formatage de textes que sont MS Word (ou Word Perfect, StarWriter...) et LaTeX.

Gris typographique et WYSIWYG

Lorsque l'on utilise un traitement de textes basé sur le concept du WYSIWYG, les caractéristiques géographiques des blocs de texte sont éparpillées dans les divers dispositifs de commande offerts à l'utilisateur (menus, barres d'outils) : dans Word, une partie des commandes se trouve dans le menu Fichier, sous la rubrique Mise en page -- marges, recto-verso -- ; le reste des caractéristiques contribuant au gris typographique dépend fortement de la manière dont l'utilisateur se sert de l'outil. On peut, en effet, modifier nombre de celles-ci par l'intermédiaire des menus (Format, Paragraphe -- espacement avant et après le paragraphe, justification, retrait, indentation -- ou Caractères -- police, corps enrichissement --). Certains attributs du gris typographique peuvent aussi être manipulés par des boutons (gras, interlignage...) de manière quasi directe, interactive. L'interface graphique, sous le prétexte de la facilitation des manipulations de l'usager, contribue donc à faire éclater l'unité conceptuelle du gris typographique.
Dans le cas d'un écrit long (rapport, ouvrage, mémoire...), l'insertion de ruptures que constituent les sauts de page et de section augmente potentiellement l'éclatement du concept de gris typographique. De ce fait confirmé par l'expérience quotidienne du contact avec des utilisateurs, on peut poser que l'outil envisagé ne permet pas obligatoirement de créer un document prenant en compte la notion de gris typographique et les régularités qui en découlent. Cet éclatement conceptuel est aussi source potentielle de grandes difficultés de compréhension (et donc de manipulations) pour l'utilisateur final : devenir un utilisateur compétent suppose en effet de rassembler les bribes du concept éclatées dans l'interface et de reconstruire le concept de base et ses attributs.
L'utilisateur peut cependant se montrer plus soucieux de régularité et plus prévoyant, en utilisant des styles (de paragraphe ou de caractère), accessibles au travers du menu Format, Style, Définir ou Modifier. Après avoir été créés, ces styles qui ne sont que la définition de l'aspect d'un fragment de texte et d'une partie seulement de son gris typographique, sont accessibles par l'intermédiaire d'une liste déroulante, située à gauche dans la barre d'outils. Cependant, ces styles ne contiennent que des informations liées à la présentation de l'élément en question et donc à la notion de gris typographique. Ce dispositif ne fait que rassembler un certain nombre d'attributs qui sont appliqués aussitôt à l'élément considéré : ils ne contiennent pas (ou peu) d'information sémantique car il est, par exemple, possible et autorisé d'insérer un titre de section avant un titre de chapitre. Le concept de gris typographique est utilisé de manière procédurale. Enfin, la notion de modèle de document utilisée par le logiciel Word ne fait que rassembler certains styles ; elle peut être considérée comme relativement mineure dans la perspective étudiée.
De cette revue sommaire, on peut retenir qu'un traitement de textes, basé sur le paradigme du WYSIWYG, produit un éclatement de la notion de gris typographique en proposant à l'utilisateur des ensembles de commandes situés à des niveaux différents et variés de l'interface. Cet éclatement conceptuel ne semble pas de nature à faciliter la tâche de l'utilisateur de l'outil traitement de textes. La question du gris typographique est instaurée en dehors de toute analyse du contenu du texte, de toutes perspective éditoriale.

La perspective éditoriale

Cette question, en toute logique, devrait être posée prioritairement à celle de la finalisation du texte car il ne saurait y avoir impression avant établissement du texte, c'est-à-dire avant son écriture proprement dite : cependant, le paradigme du WYSIWYG instaure de manière prioritaire la finalisation en privilégiant l'aspect visuel du texte par rapport à son contenu. Il serait, à ce sujet, intéressant d'examiner les divers outils dans cette perspective et de conclure que les outils de traitement de textes offrent bien plus d'accessoires permettant la finalisation que la production du texte. Il faut cependant reconnaître que les accessoires utiles pendant la phase strictement élaborative sont nettement plus complexes à élaborer, voire insuffisants (cf. les divers dictionnaires, correcteurs orthographiques, syntaxiques...) que ceux permettant la mise en forme d'un texte élaboré.
Sans entrer dans le détail, fort complexe et toujours discuté au niveau scientifique, de la modélisation des opération cognitives effectuées par un scripteur dans une tâche d'élaboration d'un texte écrit, on se contentera de considérer sont résultat du point de vue de l'auteur. Dans cette perspective, le texte peut être caractérisé par une certaine structure logique : ici l'introduction, là un titre, là un paragraphe... On peut rendre compte de cette structure en utilisant une grammaire formelle, laquelle conduit à la hiérarchisation des éléments textuels : un paragraphe est un élément d'un section, une section élément d'un chapitre... Certains logiciels permettant la visualisation de textes (par exemple Acrobat Reader de la société Adobe) utilisent de manière explicite la structure du texte pour permettre son parcours. De ce fait, le texte, dans la perspective éditoriale, n'est plus une simple suite de rectangles colorés, mais se montre proche d'une base hiérarchique de données.
Cependant, il ne faudrait pas croire que les deux structures définies (gris typographique et base hiérarchique de données textuelles) s'opposent et entrent en conflit : tout le travail du typographe consiste à caractériser visuellement chacun des types d'éléments définis dans la base, dans un souci de respect du texte originel de l'auteur. Ainsi, si vous reprenez le calque élaboré précédemment, vous pourrez vous rendre compte de la correspondance entre les deux aspects visuel et logique de la modélisation d'un même texte. On doit d'ailleurs noter que toute irrégularité dans la correspondance est source de difficultés pour le lecteur du texte (ce qui constitue la principale difficulté de l'utilisation des outils de PAO malgré l'apparente facilité de leur manipulation). À cause de la correspondance -- l'isomorphisme -- entre le marquage logique et le marquage typographique, une nouvelle possibilité est mise au jour : la possibilité d'associer automatiquement à chaque élément structurel, par un marquage déclaratif, un certain aspect visuel.

Contrairement à la prédominance de l'aspect visuel du texte établie par la perspective typographique, la perspective éditoriale met en avant l'aspect logique du texte et de l'organisation du discours. Le travail second (temporellement) du typographe consiste à établir un isomorphisme entre deux structures. Cet isomorphisme, permettant par définition d'établir une correspondance terme à terme entre les éléments des deux structures, est à la source d'une autre conception de la création de documents.

L'autre conception de la création de documents

En fondant conceptuellement la création de documents à partir de la structure logique du texte à produire, on met à la première place la description de cette structure et en second la structure visuelle. Ce déplacement de la priorité des éléments entraîne des changements importants : les attributs typographiques et visuels sont attachés à des éléments logiques appartenant à une certaine classe de documents. Ils n'en sont donc qu'une conséquence : à chaque élément logique décrit (titre de niveau n, paragraphe, citation...) sont attachés des caractéristiques typographiques (police, taille, graisse, espace avant et après...). C'est ce qui caractérise la différence entre LaTeX et les traitements de textes cités précédemment.
LaTeX ne permet pas l'édition du texte, il est -- strictement parlant -- un outil de formatage de textes et non une trousse à outils plus ou moins complète (éditeur, traitement, finalisation...). LaTeX n'est qu'un outils permettant de remplacer automatiquement des commandes du niveau de la logique éditoriale par des commandes du niveau de la logique typographique, les seules interventions de l'utilisateur se traduisant lors de la confection de classes de documents, incluses dans des « packages ». Cette possibilité confère à l'outil une extensibilité quasi illimitée, encore accrue par la disponibilité du code source du logiciel. Par conséquent, le traitement n'a aucune raison d'être interactif. Il ne fait que s'inscrire dans un modèle en couches du traitement du texte du document : la tâche d'élaboration, de rédaction s'effectue lors de l'édition. Au moyen de balises textuelles, l'auteur effectue la description logique de la structure du texte.
Un outil spécifique transforme ces balises en marques d'enrichissement typographique (toujours sous une forme textuelle). Ces marques sont traduites, indépendamment du périférique de sortie (DVI -- DeVice Independant), par un logiciel Spécifique, TeX, considérant que chaque élément (de la lettre aux entités supérieures) occupe un rectangle sur la page ou dans le document. Ce positionnement physique est affecté d'une certaine élasticité (la conception de Donald Knuth), afin de permettre des ajustements locaux fins. Finalement un dernier dispositif logiciel se charge du rendu du document en fonction d'un périférique donné.

Conclusion

En guise de conclusion, j'ajouterai que la qualité typographique nettement inférieure des traitement de textes limite leur utilisation à de simples lettres et autres mémos. Notons qu'il est tout à fait possible de produire des documents fait à partir de formateurs de textes d'aussi piètre qualité que ceux faits par les traitements de textes, mais c'est beaucoup plus difficile, tout comme il est difficile d'obtenir des documents de qualité avec les traitements de texte.

Version DVI
Version PostScript
Version PDF


Thomas Nemeth :
email
Linux Power
Page modifiée le 7 mars 2003