Pourquoi le document importe

Par Jean-Michel Salaün, professeur à l’École normale supérieure de Lyon

Par Jean-Michel Salaün, professeur à l’École normale supérieure de Lyon

small

Chercheur en sciences de l’information, Jean-Michel Salaün est professeur à l’École normale supérieure de Lyon où il est en charge du premier master francophone sur l’architecture de l’information. De 2005 à 2010, il était directeur de  l'École de bibliothéconomie et des sciences de l'information de Montréal (Ebsi). Il a été auparavant professeur à l’École nationale supérieure des sciences de l’information et des bibliothèques en France, où il a pris pendant une quinzaine d'années diverses responsabilités, dont l'animation du réseau du CNRS RTP-Document. Ses travaux portent sur l’économie du document, les développements du document numérique et le management des bibliothèques, la pertinence d'une théorie du document pour analyser la structuration du Web. Il est l’auteur ou le co-auteur de nombreux ouvrages et articles sur ces questions. Il anime un blog proposant un repérage de données sur l'économie des documents dans un environnement numérique.

_____________________________

Depuis le « documentum » latin jusqu’au document numérique et au Web de données, le document a une longue histoire qui s’inscrit au cœur de la régulation de nos sociétés. Pour comprendre les transformations profondes qui sont en train de s’élaborer, il est nécessaire d’analyser les évolutions des différentes acceptions de ce qu’est le document et ses interactions avec la régulation de la société. En retraçant l’histoire de ces définitions, au travers d’un grille tridimensionnelle, forme contenu et médium, que chaque document doit intégrer, ce texte permet de poser les bases d’un questionnement indispensable sur la manière dont la transformation du document par le numérique accompagne des évolutions sociales et sémantiques à l’œuvre au cœur de nos sociétés1.

_______________________________

DU « DOCUMENTUM » AU DOCUMENT OMNIPRÉSENT

Issu du latin « documentum », le mot français « document » apparaît de façon épisodique au XIIIe siècle, le plus souvent sous la forme plurielle « documens » ou « documenz ». Le Dictionnaire du Moyen Français2 donne ces deux acceptions : « A. – Leçon, enseignement […] ; B. – Acte écrit qui sert de preuve ». Ainsi, même s’il est alors peu usité, le terme contient depuis le Moyen Âge deux sens complémentaires qui se sont affirmés au cours des siècles avec la mise en place de procédures spécifiques : transmettre et prouver. Au Moyen Âge, les « documens » sont d’abord des leçons qui ne sont pas nécessairement consignées par écrit. Le « doceo » latin signifie « enseigner », « documentum » est l’action d’enseigner. 

La seconde acception, celle de preuve, fait référence à des titres, souvent des titres de propriété. L’anglais « record », littéralement « enregistrement », que l’on traduit souvent en français par « document », rend bien compte de cette fonction. Voici ce que dit l’Oxford Dictionnary de son étymologie : « Moyen anglais : du vieux français record « souvenir », du latin recordari « se souvenir », construit sur cor, cord- « le cœur ». Le nom a été très tôt utilisé dans le droit pour signifier la preuve écrite. Le verbe signifiait originellement « relater oralement ou par écrit » et aussi « répéter pour garder en mémoire3 ». Ainsi, selon leur étymologie, le « document » français et le « record » anglais ont quasiment la même signification, mais proviennent de deux mots latins différents : le premier privilégie la transmission et la leçon, le second la mémoire et la preuve.

La notion moderne de document, qui amalgame les deux acceptions, résulte sans doute du lent croisement des pratiques légales et confidentielles et des pratiques monastiques de transmission, plus nobles et publiques. Elle résulte aussi, et peut-être plus sûrement encore, de la transformation du rapport à la vérité qui n’est plus révélée, préservée et donnée par la religion et le prince, mais construite par la raison et la démonstration.

Quoi qu’il en soit, le terme document ne semble pas avoir été très usité jusqu’à la fin du XVIIIe siècle. Déjà, pourtant, au cours de ce siècle, parallèlement à l’espace public, les « infrastructures épistémiques » s’organisent pour une meilleure présentation, classification et confrontation de documents issus de l’activité scientifique, notamment en muséums, bibliothèques académiques ou revues savantes. Le mot « document » s’affirme réellement à partir du XIXe siècle, et surtout au XXe siècle, comme signifiant un véhicule privilégié de la circulation du savoir, la diffusion des techniques et certainement aussi la stabilité des organisations et le développement du commerce. Dès lors, il est probable que son succès contemporain découle directement de la révolution scientifique et industrielle qui avait besoin d’outils puissants à la fois pour transmettre, pour convaincre et prouver. 

La popularité grandissante du mot reflète ce vaste mouvement. Mais il faudra attendre tout de même la neuvième édition du dictionnaire de l’Académie — celle de 1992 ! —pour que sa définition s’étoffe et dépasse deux lignes. Pourtant, nous sommes aujourd'hui envahis par les documents, dans nos poches, sur et dans nos meubles, sur nos lieux de travail, à notre domicile comme dans les espaces publics et plus encore partout sur la Toile. Tout le social est concerné, depuis la famille, l’école, les administrations, l’organisation du travail, celle de l’industrie et du commerce, les loisirs, la culture, la définition des États, le développement de l’espace public, les échanges internationaux et, bien sûr, la technique et la science. Les documents participent à la régulation de tous les rouages de la société, y compris souvent aujourd'hui à celle de notre vie privée. Nous parlons de « documents » à propos de tout, au point que le mot s’est quelque peu vidé de sa substance.

PREMIÈRES DÉFINITIONS

La première définition sérieuse du « document »4 est sans doute celle du Belge Paul Otlet (1868-1944) : « Le Livre [ou le document] ainsi entendu présente un double aspect : a) il est au premier chef une œuvre de l’homme, le résultat de son travail intellectuel ; b) mais multiplié à de nombreux exemplaires, il se présente aussi comme l’un des multiples objets créés par la civilisation et susceptibles d’agir sur elle5 . » La définition souligne la double multiplication des documents, en types différents et en exemplaires. Elle concerne des documents publiés.

Au cours des années 1950 en France, Suzanne Briet, dans un petit livre passionné, a élargi et approfondi la réflexion en proposant la définition suivante : « Tout indice concret ou symbolique, conservé ou enregistré, aux fins de représenter, de reconstituer ou de prouver un phénomène ou physique ou intellectuel »6  . Tout objet porteur d’information est un document, pour peu qu’il soit inclus dans un système documentaire. Si Paul Otlet privilégiait la transmission, Suzanne Briet insiste sur la preuve, au sens large de représentation fidèle. Les deux fonctions originelles se confondent de plus en plus dans la publication scientifique moderne. 

Pour la plupart des textes réglementaires contemporains ou des normes, le document est un objet (matériel ou électronique) sur lequel est consignée une information.  Il aurait donc deux dimensions, celle du support et celle du contenu. Mais cette présentation duale est insuffisante : elle occulte la fonction sociale, ce qui donne au support et à l’information sa fonction de document. En France, un réseau de chercheurs, connu sous le pseudonyme Roger T. Pédauque7 , a proposé une grille tridimensionnelle – forme, contenu ou texte, et médium—, résumée de façon succincte par trois participes passés : vu, lu et su. 

  • Vu : forme

La première dimension, celle de la forme, est anthropologique. Il s’agit du rapport de notre corps et de nos sens à l’objet document, quel que soit le sens qu’il véhicule. Un document doit être immédiatement appréhendable comme tel. Un lecteur averti sera capable de repérer la collection ou l’éditeur d’un livre de loin dans une bibliothèque. Sa couverture, son titre, son auteur, lui permettront de le ranger dans tel ou tel genre. La structure logique en pages, en chapitres, avec une table des matières, etc., lui est familière et lui permet de feuilleter le livre sans s’y perdre.

Cette habileté de repérage de documents est essentielle à notre vie quotidienne et n’est, bien sûr, pas exclusive au livre. Nous repérons sans difficulté un passeport parmi des dizaines d’objets sur une table. Il est aussi important de retrouver facilement factures, contrats, courriers, etc. Inversement, si nous ne sommes pas familiers avec la présentation d’un document, s’il ne correspond pas pour nous à un environnement de lecture suffisamment connu pour que nous ne nous y perdions pas, il nous sera difficile de le repérer, et celui-ci n’existera tout simplement pas pour nous. 

Pédauque a résumé cette première dimension par une équation : « document = support + inscription ». Pour les documents imprimés, l’inscription et le support sont solidaires. La solution de l’équation se résume donc à une simple question de perception. Celle-ci se complique avec l’audiovisuel, puisque l’enregistrement et la restitution supposent un appareillage. Le document est alors reconstruit à partir d’un signal enregistré avant de pouvoir être perçu. Le décodage est une transposition d’une forme à une autre, avec simplement des risques de brouillages. Pour les documents numériques, l’équation se complique encore. Les logiciels de gestion et d’affichage des documents, les formats de fichier manipulent la structure logique du texte, ou encore le protocole de partage et le système d’adressage autorisent une réinvention du document. À partir des mêmes éléments enregistrés, plusieurs documents différents peuvent être restitués.

Dans cette première dimension, le document n’est qu’une promesse. Sans connaître son contenu, nous savons déjà que c’est un document et nous pressentons qu’il sera pour nous utile, intéressant, distrayant ou, à l’inverse, sans attrait. Mais une promesse doit pouvoir être tenue, sans quoi elle n’est rien. On ne saurait donc se contenter de voir un document, il faut aussi pouvoir en consulter le contenu, même si cette potentialité n’est pas toujours mise en œuvre.

  • Lu : texte

La deuxième dimension, celle du contenu ou du texte, est intellectuelle ou, si l’on veut, «neuro-anthropologique»8. Il s’agit du rapport de notre cerveau et de ses capacités de raisonnement au contenu du document, quelle que soit la façon dont il est représenté, une écriture, une image animée ou non, un son ou encore la combinaison de tous ces éléments. Notre cerveau, par l’intermédiaire de nos sens, décode l’inscription proposée pour pouvoir interpréter la représentation qu’elle propose. Cette dimension met en avant la signification. Le décodage de l’inscription peut être réalisé par nous-mêmes, par une machine ou par les deux. Dans le cas du document le plus traditionnel qui supporte un texte écrit, le décodage est réalisé par le lecteur. Cela suppose qu’il a effectué, sans doute dans son enfance, un long apprentissage pour savoir lire.

C’est pour cette dimension du texte que les chercheurs ont mis en avant la notion de contrat de lecture, montrant notamment qu’elle sous-tend dans la littérature la notion de genre9. Pour qu’un texte appartienne à un genre, il doit suivre certaines règles d’écriture qui, familières au lecteur, lui permettront d’entrer dans l’univers de l’auteur.

L’informatique a fait un pas supplémentaire en autorisant le calcul, les manipulations logiques, par le code. Les documents numériques peuvent non seulement être décodés par les machines, mais « interprétés », ce qui ouvre la porte à bien des applications inédites pour le traitement automatique de la langue, la statistique ou encore l’ingénierie des connaissances, comme les tentatives de traduction automatique, les moteurs de recherche ou encore les applications du Web sémantique. Aujourd'hui, on feuillette, on navigue, on consulte, on recherche, on copie/colle sur le Web plutôt qu’on ne concentre son attention sur un texte long. Le texte est déconstruit, au moins en partie, et de nouveaux contrats de lectures se mettent progressivement en place définissant de nouveaux genres : blogs, vidéos courtes, tweets, mélanges de contenus audio ou vidéo (« mashups »), etc.

  • Su : médium

La troisième dimension est donc celle de la médiation. Quels que soient sa forme et son contenu, le document a une fonction sociale. Nous avons vu que les deux fonctions, transmettre et prouver, ont évolué en fusionnant et en s’élargissant. Aujourd’hui, on dit « informer » sans que l’acception du verbe soit très précise. Malgré tout, la partition initiale reste utile pour raisonner, car les deux termes ne renvoient pas aux mêmes univers. Transmettre se conjugue en espace et en temps, tandis que prouver se conjugue en véracité et en confiance. 

Il s’agit d’abord de transmettre à d’autres, et au-delà de l’ici et du maintenant, un contenu à l’aide d’une forme. Le document, par le système de diffusion qui lui est associé, est un médium qui permet de faire passer un texte mis en forme au-delà du cercle intime et de la barrière du temps. Le document est un objet mémoriel : on enregistre une information (texte) sur un objet (forme) pour pouvoir la transmettre ou s’y référer, autrement dit pour qu’elle puisse être « sue » dans un autre lieu et à un autre moment. L’ensemble du système documentaire est en quelque sorte notre mémoire externe, pour paraphraser Stanislas Dehaene ou Michel Serres10.

Pour fonctionner, ce système devra mettre en place un ensemble contractuel pour que les maillons de la chaîne s’articulent correctement et que les intérêts de chacun puissent être préservés. Le terme « contrat » est employé ici dans un sens moins métaphorique ou implicite que pour les contrats de lecture des deux dimensions précédentes. Il a des applications juridiques et suppose des transactions financières, comme un règlement de facture ou un paiement de droits, ou des obligations, comme le dépôt légal ou la propriété intellectuelle.

Le rapport au passé différencie le document du spectacle, qui se produit à un moment et dans un lieu où il s’écoute ou se regarde, et de la conversation en présence des interlocuteurs. Le spectacle et la conversation sont des performances. Le direct télévisé et radiophonique ou le téléphone ont permis de briser la barrière de l’espace, mais pour passer celle du temps, il a fallu avoir recours à l’enregistrement, c’est-à-dire transformer ces performances en document. Une fois de plus, le numérique, tout particulièrement le Web, modifie considérablement le rapport au temps et à l’espace. La séparation entre la performance et le document, entre la communication et l’information, entre la conversation et la publication s’estompe. On enregistre, discute et publie d’un même clic. D’une certaine manière, on retrouve le « doceo » oral du Moyen Âge.

  • Intégration

Chacune de ces dimensions a sa propre logique qui ne se réduit pas aux autres et, pourtant, aucune n’est complètement indépendante des deux autres. Un document doit intégrer et coordonner les trois. Ses modalités anthropologiques, intellectuelles et sociales doivent non seulement être efficientes prises chacune séparément, mais encore être cohérentes entre elles.

Pédauque, qui a suggéré cette partition en trois dimensions, conclut ainsi sa proposition : « Notons enfin que dans chaque entrée, nous avons insisté sur l’idée de contrat de lecture traduit par la lisibilité dans la première, par la compréhension dans la seconde et par la sociabilité pour la troisième. Il est probable que ce contrat à trois facettes présente, dans toutes les nuances que nous avons exposées, la réalité de la notion de document. Un document ne serait finalement qu’un contrat entre des hommes dont les qualités anthropologiques (lisibilité - perception), intellectuelles (compréhension - assimilation) et sociales (sociabilité - intégration) fonderaient une part de leur humanité, de leur capacité à vivre ensemble. Dans cette perspective, le numérique n’est qu’une modalité de multiplication et d’évolution de ces contrats »11.

INTERROGER LA VALEUR SOCIALE DU PROCESSUS DOCUMENTAIRE

Sur la base de ces constatations, une définition pourrait être : « un document est une trace permettant d’interpréter un événement passé à partir d’un contrat de lecture ». Nous retrouvons bien les trois dimensions, matérielle avec la trace (vu), intellectuelle avec l’interprétation (lu), mémorielle avec l’événement passé (su), ainsi que la nécessaire construction sociale avec le contrat. La notion de trace permet d’élargir la définition du document à toutes sortes d’objets comme l’avait proposé Suzanne Briet. Une étoile dans le ciel, une antilope, pour reprendre ses exemples, peuvent être des documents pourvu qu’elles soient les témoins d’un savoir inscrit dans un système documentaire. L’interprétation de chaque document passe par le régime documentaire auquel est rattachée la trace. Ce régime peut être très varié : juridique, fictionnel, scientifique, coutumier, amical, etc. Enfin, la référence à un événement passé ne signifie pas nécessairement la relation de cet événement, mais bien que le document fait le lien entre quelque chose qui s’est déroulé dans le passé dont il est la trace et aujourd’hui. La trace peut être fortuite, un indice, ou construite, un texte. Le document est une façon de retrouver notre passé et, nécessairement, de le reconstruire en fonction de notre présent pour orienter notre futur. 

Mais cette définition a un défaut. Elle ne permet pas de rendre compte d’une qualité essentielle du document ordinaire qui a justement autorisé sa mise en système et donc fait son succès : sa reproductibilité, sa plasticité, son traitement. Sans doute n’importe quel objet peut devenir un document, mais il reste alors unique. C’est en quelque sorte un prototype documentaire, disons un « protodocument ». Le document dans sa version la plus ordinaire est un texte, une représentation formelle de ce prototype sur un support maniable. Si le protodocument est déjà d’ordre textuel, il pourra être directement la matrice du document, comme dans le cas de la copie des scribes ou de l’imprimé. Dans le cas contraire, des textes viendront documenter le protodocument, jusqu’à parfois le remplacer, depuis les notices jusqu’aux enregistrements analogiques.

La définition du célèbre bibliothécaire indien Shiyali Ramamrita Ranganathan insiste, elle, justement sur ses qualités manipulatoires : « Un document est une micro-pensée enregistrée ["embodied micro thought"] sur papier ou sur un autre support, qui permet une manipulation physique facile, un transport dans l’espace et une préservation dans le temps. »   . Cette définition intéressante a le défaut inverse de celle proposée plus haut. Elle oublie les protodocuments et ne rend pas compte de la valeur sociale du processus documentaire. 

Pour marier les qualités des deux définitions, nous pouvons alors les articuler en disant : « un protodocument est une trace permettant d’interpréter un événement passé à partir d’un contrat de lecture. Un document est la représentation d’un protodocument sur un support, pour une manipulation physique facile, un transport dans l’espace et une préservation dans le temps »12.

Si l’on poursuit le raisonnement, la multiplication des documents et des genres dans toutes sortes de registres et leur transformation que nous avons décrites témoignent  alors d’une relation fiévreuse à notre passé, une sorte d’interrogation existentielle sur notre présent face à un futur angoissant dont les termes se renouvellent sous nos yeux. Cela correspond bien au dilemme de la révolution scientifique ou de la représentation politique qui l’accompagne face à la relativisation d’une vérité révélée par l’église du Moyen Âge ou d’un pouvoir monarchique.

DOCUMENT ET WEB DE DONNÉES, UNE TRANSFORMATION RADICALE

Avec le nouveau millénaire, le document désormais numérique n’est plus, nous l’avons vu, qu’un ensemble de signaux dans un vaste flux. Chacun, publiant directement sur le Web, se ressent auteur. L’indexation n’est plus l’apanage des documentalistes et les métadonnées sont devenues indispensables à la « navigation » sur le Web. Les journaux sont concurrencés par les témoignages des internautes. Le document est aujourd’hui un ensemble de pièces éparses réagencées à la volée, une tête d’un réseau concrétisée par les liens hypertextuels, et les traces laissées par les internautes sont des outils de gestion du trafic et des stratégies des firmes. Tous ses éléments constitutifs sont bousculés et la notion de document elle-même est ébranlée.

Mieux ou pire, le Web de données, par ses capacités calculatoires, a l’ambition de reconstruire des documents à la demande, nous donnant l’illusion d’avoir toutes les réponses à nos questions avant même qu’elles ne soient posées, comme si notre futur était un destin déjà inscrit dans les machines ou comme s’il n’était que la solution d’un problème dont il suffirait de traiter les « données » par des algorithmes de plus en plus puissants.

Ainsi, la transformation du document par le numérique, voire son effacement au profit des données, n’est pas une évolution anodine. C’est un symptôme important de modifications de la régulation de nos sociétés, jusqu’à l’organisation de nos vies quotidiennes. Cette transformation modifie notre relation au savoir et elle marque un rapport différent à notre passé. Elle a un impact sur l’évolution de la notion d’information, sa conservation et sa transmission. Ces changements ne sont évidemment pas une simple conséquence de choix techniques, ils accompagnent des évolutions sociales et sémantiques profondes. Ils mériteraient une meilleure discussion collective, une méditation sociétale pourrait-on dire, où les sciences humaines et sociales, en particulier les sciences de l’information, ont un rôle spécifique à jouer.

Jean-Michel Salaün, professeur à l’École normale supérieure de Lyon


Mise en ligne : juin 2012

_______________________________

1. Cet article est une version abrégée et remaniée du chapitre 2 du livre du même auteur : Jean-Michel Salaün, Vu lu su. Les architectes de l’information face à l’oligopole du Web, Paris, La Découverte, collection « Cahiers libres », 2012. 151 p.

2. Dictionnaire du Moyen Français (1330-1500), Atilf (Analyse et traitement informatique de la langue française), 2010. Voir le DMF en ligne sur le site de l’Atilf.

3. Traduction personnelle.

4.  La question de la définition du document a fait l’objet d’une nombreuse littérature. Pour une bonne recension, voir : Niels Windfeld Lund et Roswitha Skare, « Document theory », Encyclopedia of Library and Information Sciences, New York, Taylor and Francis, 2010 (3e édition), p. 1632-1639.

5. Paul Otlet, Traité de documentation : le livre sur le livre. Théorie et pratique, Bruxelles, Editiones Mundaneum, 1934, p. 9.

6. Suzanne Briet, Qu’est-ce que la documentation ?, Paris, Edit (Éditions documentaires industrielles et techniques), 1951, p. 7.

7. Roger T. Pédauque, Le Document à la lumière du numérique. Forme, texte, médium : comprendre le rôle du document numérique dans l’émergence d’une nouvelle modernité, Caen, C&F éditions, 2006. Les textes sont par ailleurs accessibles sur le site @chiveSIC (archivesic.ccsd.cnrs.fr).

8. Stanislas Dehaene, Les Neurones de la lecture, Paris, Odile Jacob, 2007.

9. Pour une vue d’ensemble, voir : Karl Canvat, « Pragmatique de la lecture : le cadrage générique », in Atelier de théorie littéraire : Genres et pragmatique de la lecture, Fabula.org, mai 2007.

10. Michel Serres, Les Nouvelles Technologies : révolution culturelle et cognitive, conférence Inria (Institut public de recherche en sciences du numérique), 11 décembre 2007, disponible sur interstices.info, rubrique « Débattre ».

11. Roger T. Pédauque, Le Document à la lumière du numérique, op. cit., p. 78. 

12. Cité par Michael Buckland, « What is a “document” ? », in Journal of the American Society of Information Science, vol. 48, n° 9, septembre 1997 (traduction de Jean-Michel Salaün).