TdM


Guy Laflèche, Université de Montréal

TGdM

  • Prologues
  1. Le texte imprimé et le texte électronique
  2. L'« ILE » des simoniaques, un bel exemple
  3. Le copyright et le droit d'auteur, CONTRE !
  4. Historique des sites littéraires sur la toile
  5. Droit de reproduction sur la toile, POUR !
  6. La bibliothèque électronique de Google, POUR !
    1. La République française contre Google
    2. La BNQ /les « BANQ » à l'ère de Google
    3. L'Encyclopédie de la Francophonie contre Wikipédia
    4. Le discours de la République : baroud d'honneur
IMEC / Laflèche
Ref. Cabinet Pierrat (Paris)

Droits de reproduction sur la toile
(copyrights sur le Web)
dans les sites personnels sur les oeuvres littéraires

La bibliothèque électronique de Google (1)


La République française contre Google (2004-2009)

— Quand des cowboys s'improvisent shérifs de la toile —

 

        Revenons à l'actualité que nous avons laissée aux chapitres précédents, avec les affaires MP3 et P2P (cf. chap. 3, n. (19)). Ce sera pour l'instant l'épilogue du dernier prologue.

      Nous étions à ce moment en 2005. Moins de cinq ans plus tard, l'histoire aura donné raison à ceux qui l'avaient à ce moment, nous. Il ne s'agit pas du tout de triompher, mais d'enregistrer les faits. Et puis, l'histoire ne dit jamais son dernier mot et il est possible que Jean-Noël Jeanneney, Renaud Donnedieu de Vabres, Jacques Chirac et Lise Bissonnette, voire Daniel Ichbiah, aient fait une bonne analyse de la réalité apocalyptique qu'ils prévoyaiet avec le développement de l'« empire du mal » de Google. Pour l'instant et pour longtemps, ils auront eu tort.

        Il sera question de ce que l'on appelle en France les « bibliothèques numériques », ce qui aura été une affaire d'État (2004-2008). Avec un mot bien étrange, numérique, puisqu'il s'agit manifestement d'un charabia d'informaticien, « numériser » et son dérivé « numérique » désignant l'opération qui consiste à scanner les pages d'un livre pour en produire une image virtuelle ou une version électronique. Je veux bien croire, puisque c'est la réalité, que le scanneur produit, par balayage optique, une traduction de l'image en pixels (picture elements), en bits (binary digits) et donc en série numérique de système binaire, mais de là à parler sans rire de « numériser », de « numérisation » et de « bibliothèque numérique », il faut vraiment baragouiner son français.

Définitions : éditions et bibliothèques virtuelles ou électroniques

        Comme nous ne sommes pas pressés, commençons donc par le vocabulaire, de sorte qu'on se comprenne. En imprimerie, en cartographie et en médecine, on nomme aujourd'hui scanneur (ou moins correctement du mot anglais scanner) l'appareil qui sert à prendre une photographie sous forme de version électronique. Scanner est le verbe qui traduit cette opération. Manifestement, numériser et numérisation sont des hypercorrections qui tentent de rendre les anglicismes digitaliser et digitalisation, qui dénotent le vocabulaire spécialisé de l'informatique, alors que le numéro, la numérotation et leurs dérivés concernent nécessairement et par définition le système décimal, numériser et ses dérivés, des opérations mathématiques, ce qui n'a et ne peut rien avoir en commun avec les bibliothèques ! Exit la bibliothèque numérique, expression du plus haut comique en français. On parlera donc de bibliothèques virtuelles ou électroniques. Or, ce n'est pas la même chose.

        Il faut en effet distinguer deux grandes formes d'édition sur la toile, l'« édition virtuelle » et l'« édition électronique », et opposer en conséquence deux sortes de bibliothèques, la « bibliothèque virtuelle » composée idéalement de textes électroniques et la « bibliothèque électronique », composée elle de textes virtuels. Ce croisement peut paraître surprenant, mais il est tout à fait logique. La bibliothèque virtuelle est sur la toile l'équivalent d'un musée (ce qu'est fondamentalement une bibliothèque d'encre et de papier), proposant ses livres à la lecture, en tout ou en partie, avec la possibilité de les imprimer. La bibliothèque électronique est tout autre chose : il s'agit d'un corpus de centaines, de milliers, de millions d'ouvrages destinés non à la lecture, ni même à la consultation à proprement parler, mais bien à la recherche, plusieurs sortes de recherches qui dépendent des logiciels qui permettent de les interroger. Voyons cela en présentant les quatre réalités en cause ici.

1.  Édition virtuelle

Exemples : maldoror.org ou desade.free.fr

Définition : édition documentaire, sous forme photographique ou textuelle, d'oeuvres transmises par l'intermédiaire de la toile.

        Il s'agit donc de la communication électronique d'un document.

2.  Édition électronique

Exemples : Maldoror (centre Phalèse de Paris 3) et Artamene.org.

Définition : édition critique ou commentée d'une oeuvre ou des oeuvres d'un auteur en version html, souvent annotée, généralement accompagnée de dossiers (bibliographies, études, annexes, références critiques sur la toile).

        Il s'agit donc de l'édition électronique d'un document, comme son nom le dit, et non simplement d'une forme de communication du document parmi d'autres, la communication électronique.

3.  Bibliothèque virtuelle

Exemples : Gallica.fr (Gallica 1) et Canadiana.org. Parmi de très nombreux exemples, des milliers, donnons aussi celui de la bibliothèque de Lisieux, bmlisieux.com.

      [Parenthèse. La Bibliothèque mondiale, de l'Unesco (wdl.org), doit aussi être retenue comme exemple précisément parce que c'est une trop belle illustration de la bibliothèque virtuelle. Elle a été réalisée principalement à partir de la Bibliothèque du Congrès des États-Unis, qui a proposé plus de la moitié des quelque mille livres venant de vingt-cinq bibliothèques de par le monde. Il s'agit de la plus belle réalisation technique au moment de son lancement (le 21 avril 2009) aussi bien pour sa simplicité d'utilisation que pour son efficacité de consultation. En revanche, cette extraordinaire qualité technique est au service d'une bibliothèque virtuelle mondiale dont le corpus est un régal qui mériterait son étude critique : s'il est heureux que le Des Sauvages de Samuel de Champlain figure au nombre des 13 livres qui représentent le Canada et par conséquent le Québec, le corpus des 31 livres qui présentent la France n'a pas de quoi étonner ! avec les fables de La Fontaine, choisies pour enfants, dans l'édition illustrée par Louis-Maurice Boutet de Monvel en 1888, le magnifique Livre d'heures de Guillaume François de Bure et près d'une dizaine de Vues de Lourdes...]

Définition : édition systématique d'un corpus d'ouvrages choisis qui peuvent être consultés sur la toile, sous forme de photographies ou sous forme de textes — ou les deux.

        Comme on le voit, l'accent est mis sur la réalité individuelle des ouvrages que la bibliothèque permet de consulter et d'imprimer. Il s'agit d'une collection d'ouvrages, comme c'est le cas déjà des bibliothèques d'encre et de papier. Idéalement, chacun de ces ouvrages devrait être l'occasion d'une édition électronique. C'est le cas, remarquable et exceptionnel, de l'édition du roman d'Émile Zola, le Rêve, sur Gallica.

        La bibliothèque virtuelle permet de prendre connaissance de fonds d'archives, d'ouvrages ou de passages de manière efficace et rapide. On devrait pouvoir consulter ou lire les Misères de Victor Hugo, par exemple, sans avoir à se rendre à la BNF, la version préliminaire inédite des Misérables ne se trouvant pas actuellement en librairie et fort rarement en bibliothèque (édition du manuscrit par Gustave Simon, Paris, Baudinière, 1927, 2 vol.).

4  Bibliothèque électronique

Exemples : FRANTEXT (ATILF de Nancy) et ARTFL (Chicago), Recherche de livres de Google.

—— Les projets concurrents ont été abandonnés, comme Europeana (BNF, 2007-2008, aujourd'hui fermée et remplacée par un vaste « portail » des bibliothèques et des musées européens) ou ne paraissent plus viables : le projet d'Open Content Alliance est maintenant intégré à Archive.org (the Open Library). En revanche, on peut espérer que Gallica 2 (lancé en mars 2008) puisse avant longtemps être compté non seulement au nombre des bibliothèques virtuelles, mais également des bibliothèques électroniques, bien que ce ne soit manifestement pas sa vocation.

Définition : édition documentaire de vastes corpus d'ouvrages dont le lexique peut être interrogé systématiquement sous forme de chaînes de caractères.

        Il ne s'agit plus, évidemment, au sens classique, d'une « bibliothèque », c'est-à-dire d'une collection de livres, mais bien d'une base de données, dont les données sont les mots des textes des ouvrages. C'est son corpus. Or, l'intérêt de la bibliothèque électronique est rigoureusement proportionnel à l'étendu de son corpus (en milliers, en millions d'ouvrages) et au système de recherche qui permet de l'interroger, soit à la possibilité de recherches ponctuelles ou statistiques, dont les cas les plus fréquents sont les recherches d'occurrences de vocables, de citations, de sources, de cooccurrences de vocables, de locutions ou de tournures syntaxiques, de regroupements en chaînes étymologiques ou en familles de mots, d'index de noms propres de divers domaines. Certes, ces corpus électroniques peuvent être utilisés pour la recherche bibliographique ou encore et surtout comme dictionnaires et encyclopédies brutes (c'est-à-dire qu'on peut y trouver ce qui permet de « constituer » une entrée de dictionnaire de langue ou un article d'encyclopédie); mais ils sont surtout ouverts aux recherches, les études statistiques, lexicales, grammaticales et stylistiques, en particulier — bien que les voies de la recherche sur ces corpus soient déjà un défi pour l'imagination.

Le projet Recherche de livres de Google

Recherche de livres de Google — Beta
< books.google.fr > ou < books.google.com >
.

        Le projet de Google a d'abord été connu sous le nom de Google Print. Le volet pour les éditeurs a été présenté à la foire du livre de Franckfort en octobre 2004, alors que le volet pour les bibliothèques a été lancé un mois plus tard, le 12 décembre 2004. À ce moment, une entente était intervenue entre la compagnie Google et cinq grandes bibliothèques universitaires pour mettre en place une bibliothèque électronique. Il s'agissait des bibliothèques de Harvard, de Stanford, du Michigan, de New York, quatre grandes bibliothèques des États-Unis, auxquelles s'ajoutait la bibliothèque britannique d'Oxford. L'objectif était alors de scanner, pour commencer, quinze millions de livres avant 2010, soit quatre milliards et demi de pages. S'y ajoute l'année suivante la Bibliothèque Nationale de Catalogne. Quatre bibliothèques se joignent au projet en 2006 : la bibliothèque universitaire Complutense de Madrid et celles de Californie, de Virginie et du Wisconsin aux États-Unis. En 2007, ce sera le tour de la bibliothèque universitaire du Texas et de celle de Princeton, de même que la bibliothèque cantonale et universitaire de Lausanne, première bibliothèque de langue française à participer au projet. Puis, le 23 mai de la même année, la bibliothèque universitaire de Gand en Belgique, largement francophone, fait son entrée à Google. On compte à ce moment pas moins de quinze riches et prestigieuses bibliothèques qui vont ainsi proposer sur la toile la consultation intégrale des ouvrages de leurs fonds qui sont aujourd'hui du domaine public, soit pour chacune de cent milles à quelques millions de livres. Le patrimoine mondial serait aujourd'hui de 32 millions de livres et Google se propose de les mettre en banque en quelques décennies. Depuis que le contrat entre Google et l'Université de Californie a été rendu public, en août 2006, on sait maintenant que c'était loin d'être invraisemblable. En effet, l'université s'est engagé à permettre à la compagnie de scanner d'abord 600 livres par jour, durant deux mois; après cette période de rodage, le rythme sera d'au moins 3 000 livres par jour. Oui, d'abord six cents, puis trois milles. L'objectif est de scanner en un an les deux millions et demi de livres de cette bibliothèque. Bref, en décembre 2008, Google avait scanné plus de sept millions de livres.

        Par ailleurs, au début de 2007, 10 000 éditeurs participaient déjà au projet; à la fin de 2008, ils étaient 20 000. Dans ce cas, comme les ouvrages ne sont pas du domaine public, les ententes sont conclues de manière particulière avec chacun des éditeurs qui déterminent avec leurs auteurs et ayants droit quels sont les ouvrages qui seront scannés par Google et selon quelles modalités ils seront consultés  : ou bien Recherche de livres n'en présentent que la page couverture et la page de titre, avec les coordonnées; ou bien on peut en consulter un certain nombre de pages (exprimé en pourcentage); ou bien encore on ne peut en consulter que des extraits de trois lignes, correspondant au droit de citation; ou enfin, l'ouvrage peut être consulté en entier; mais dans tous les cas, c'est l'éditeur seul qui décide de ces modalités et il peut les modifier à sa guise. Par ailleurs, non seulement l'éditeur peut se retirer en tout temps du projet, mais en plus il ne signe aucune entente d'exclusivité avec Google. En revanche, la compagnie vend de la publicité qui est mise en corrélation avec les titres et sujets des ouvrages recherchés.

Petit exemple : le Singulier chez Google

        À l'adresse suivante, sur le formulaire recherche avancée, vous remplissez deux cases : « Laflèche » dans la case auteur et « Singulier » dans la case éditeur :

Recherche de livres de Google — Beta
< books.google.fr > ou < books.google.com >
.

        Professeur à l'Université de Montréal, j'ai fondé ce que l'on peut considérer comme de petites Presses universitaires, pour publier mes livres à mon goût, avec une totale liberté d'expression. Dix de mes livres ont paru à ces Éditions du Singulier.

        Il m'a fallu, le jeudi 17 novembre 2005, moins de deux heures pour inscrire mes livres dans la banque de Google. Bien sûr, je n'ai que dix livres. Mais n'importe quel éditeur, qui peut en avoir plusieurs milliers, ne devrait pas mettre plus de temps à lancer l'opération. Et en proportion, un grand éditeur y mettra même moins de temps, car ses nombreux services administratifs et auxiliaires feront tout le reste plus efficacement que moi, certainement.

        Voici ce que j'ai fait. D'abord je me suis inscrit comme éditeur : on m'a donné un numéro de passe pour entrer dans mon dossier à titre d'éditeur (ce qui doit être confirmé par courriel). Ensuite, j'ai rempli un formulaire où j'ai énuméré les livres de mon fonds que je proposais à la banque Google : moins de deux heures plus tard, j'avais un numéro d'entrée et les consignes pour l'envoi de mes livres, soit en format pdf, soit par la poste. J'ai choisi la poste et j'ai expédié mes dix livres en Californie au coût de 25 $ canadiens (les livres ne me seront pas retournés : je suppose que les reliures seront tranchées et les feuilles mises dans la machine qui en prendra copie en format pdf en moins d'une heure, s'il faut cinq minutes par livre).

        C'est tout.

        Il m'a fallu une heure cinquante pour réaliser cette opération. Ce qui m'a demandé le plus de temps a été l'emballage et l'expédition (45 minutes au total, la poste étant à douze minutes de chez moi), et la lecture attentive du contrat qui lie le Singulier à Google. L'important sur ce dernier point est que je n'ai aucun contrat d'exclusivité avec la compagnie et que je peux me retirer du projet à ma guise, en tout temps, sans condition.

        Nous étions 10 000 éditeurs, en 2007, et nous sommes un an plus tard 20 000 à considérer que ces conditions sont pour nous très avantageuses. Forcément. Autrement, nous ne serions pas « partenaires » de Google. Par ailleurs, on compte quinze grandes bibliothèques parmi nos partenaires. Il me semble que nous sommes tous en bonne compagnie.

Les concurrents commerciaux de Google

        Il apparaîtra vite que la bibliothèque électronique de Google n'aura aucun concurrent, d'abord dans les entreprises commerciales, ensuite et surtout dans les projets gouvernementaux.

        Microsoft. À l'automne 1998, MSN Search de Microsoft était lancé et c'était alors une bibliothèque électronique d'avenir. Le projet s'est transformé, sous la pression des réalisations de Recherche de livres de Google, le 8 mars 2006, pour devenir Live Search. C'était alors le Live Search Books Publisher Program. Il est mort de sa belle mort le 23 mai 2008.

        Yahoo! C'est le 27 octobre 2005 qu'était lancée une contre-offensive commerciale d'envergure, la première phase du projet Open Content Alliance (OCA). Brewster Kahle de l'Internet Archive, porte-parole du projet, annonce une entente avec une douzaine d'éditeurs pour scanner en 2006 quelque 150 000 ouvrages. Plus d'un an plus tard, rien de cela n'aura encore été fait et l'OCA restera longtemps un grand projet. En réalité, l'OCA était une très simple et saine réaction de Yahoo! aux projets de Microsoft et de Google. La preuve aussi que les bibliothèques électroniques n'étaient plus de l'ordre de l'utopie... et que le projet de Google était inéluctable. Car, si l'OCA est une réaction commerciale bien « motivée », il ne fait pas de doute que ses bonnes intentions affichées étaient de l'ordre de la loyale concurrence. Cela dit, il s'agit d'un projet de Yahoo! avec la participation d'entreprises (Adobe et HP) et d'organismes publics (bibliothèques des Universités de Californie et de Toronto) qu'on trouvera énumérés sur son « manifeste » :

Open Content Alliance
< www.opencontentalliance.org >
.

Mais au bout du compte, cela n'aura été qu'un feu de paille, car le projet semble stagner dès après son lancement (2005-2008). On n'en trouve aujourd'hui qu'un prototype, apparemment géré par Internet Archive :

OpenLibrary.org
< www.openlibrary.org >
.

        Internet Archive. Si Brewster Kahle paraît avoir mis en place le prototype rêvé par Yaho! avec les concurrents et les opposants bon teint, bon chic, bon genre de Google, Internet Archive a aussi sa bibliothèque virtuelle. Le site annonce 1 122 092 textes en janvier 2009, en additionnant sept catalogues. S'il faut en dire un mot ici, c'est tout simplement parce que ses « usagers » (faites-nous pas rire !) siphonnent les livres de la banque Recherche de livres de Google. En 2007, probablement (car le communiqué d'Internet Archive n'est pas daté), le généreux serveur anarchique comptait 524 312 livres pris à Google : « Welcome to Google Books », déclarait-il en éditorial. À remarquer que Google a eu le bon sens de ne pas réagir jusqu'ici à ce travail bénévole de nombreux amateurs :

Archive.org
< www.archive.org >.

Amazon.com
< www.Amazon.com >
:

        Amazon. Justement, la concurrence aurait pu être féroce avec la mythique librairie virtuelle, la plus importante de toutes sur la toile qui en compte actuellement plusieurs centaines (alors que plusieurs milliers de librairies ont pignon sur toile). Mais en fait, le projet de Google n'est pas une menace pour la bonne vieille entreprise de Recherche de livres. En effet, Amazon est un système de recherche bibliographique, au service des éditeurs, des libraires et des lecteurs, c'est-à-dire une librairie virtuelle. Par exemple, la fonction de recherche qu'on trouve sur le site de la librairie n'a aucune commune mesure et même rien à voir avec le projet de Google. C'est la fonction « Search Inside » (-books, -Used books, - Magazines, etc.) sur Amazon.com. Il s'agit tout bonnement d'un instrument qui sert à trouver les ouvrages que l'on cherche. On a le même système de recherche dans toute bibliothèque virtuelle qui se respecte. Cela correspond aux fichiers « matières » ou « sujets » que l'on connaît depuis toujours dans les bibliothèques d'encre et de papier. Si Google peut avoir cette fonction, le projet n'a pas pour objet de trouver des livres, mais de les traiter. Ce n'est pas une une librairie ou une bibliothèque virtuelle, mais une bibliothèque électronique.

Les cowboys de la République, shérifs de la toile

        On peut en conclure, je crois, que Google a réussi à lancer un projet prometteur avec ses nombreux partenaires, sans l'aide d'aucun État. C'est une entreprise commerciale qui, manifestement, n'est pas dénuée d'envergure intellectuelle, s'agissant de mettre en place une bibliothèque universelle sous forme électronique.

        Or, le « projet » présenté et lancé à la fin de 2004 aura eu droit en 2005 aux foudres de la République française, sous la forme d'un véritable délire paranoïaque impliquant le président de la République, son ministre des communications, le président de la Bibliothèque Nationale et leurs porte-voix, les journalistes de la presses (le Monde, surtout, mais également le Figaro, Libération, le Nouvel Observateur, l'Express, le Soir, l'Humanité, autant de journaux où la République a pu s'exprimer sans aucune contrepartie), alors que les regroupements d'éditeurs se lançaient en conséquence dans des actions judiciaires aussi délirantes que le discours paranoïaque hallucinant des représentants et porte-parole de la République. On ne trouvera jamais ailleurs qu'en France de tels débordements affectifs de l'État, sauf au Saint-Siège du Vatican.

        Car Recherche de livres de Google est manifestement un projet commercial tout simple où aucune raison d'État n'est en cause. La France a sa Bibliothèque nationale qui a elle-même son Gallica, une bibliothèque virtuelle à sa mesure. La France et sa bibliothèque peuvent bien lancer une bibliothèque électronique si cela leur chante, et il semble que cela leur chante (ce sera en 2007-2008 le projet embryonnaire Europeana, avorté, on y reviendra), mais la République ne saurait s'en prendre à Google, c'est le bon sens le plus élémentaire qui le dit. Autrement, où allons-nous ?

        Là est justement toute la question, celle des cowboys qui se prennent pour les shérifs de la toile. Car, évidemment, la République est dans cette affaire au service des rapaces de l'édition, rien de plus, rien de moins. La facade, toutefois, est toute « culturelle ». La République défend la France, la culture française ? Eh oui, sans rire ! Alors rigolons un peu en exposant objectivement les faits et les idées ou opinions de ces gens-là qui parlent au nom de la République (50).

        « Google n'est pas la fin de l'histoire » : c'est bel et bien le titre de l'intervention publique que le ministre de la culture et de la communication de la République française, Renaud Donnedieu de Vabres, fait paraître dans le Monde le 18 mars 2005 (51). On lira plus bas ce morceau de bravoure, digne du père Ubu, que je commenterai mot à mot, dont la thèse principale voudrait que le projet de Google soit en fait un complot impérialiste visant non seulement la France, mais l'Europe et le Monde entier afin d'anglosaxonniser la culture de la planète. En janvier déjà, Jean-Noël Jeanneney, président de la Bibliothèque nationale, avait lancé une série d'interventions qui s'échelonneront sur toute l'année, sous le thème hallucinant « Quand Google défie l'Europe » (52), dont il fera finalement un livre, sous ce titre, en avril (on en trouvera le compte rendu critique plus bas).

        L'opération est assez incroyable, à commencer par sa rhétorique typique de l'Élysée, qui consiste à ne jamais formuler explicitement ce qu'on affirme pourtant clairement. On commence donc par saluer l'entreprise de Google, on émet ensuite des critiques générales, des inquiétudes et des réserves bien choisies, on met évidemment en doute le réalisme technologique de l'entreprise, sa viabilité économique, son caractère philanthropique (sic) et, bien entendu, sa valeur scientifique. Bref, on dénonce une entreprise mercantile états-unienne et anglo-saxonne, on pourfend des impérialistes. Il s'agit, il faut le rappeler, d'un discours d'État concernant un projet de la très modeste et très efficace entreprise Google que nous connaissons tous. C'est manifestement là un discours paranoïaque. Or, voilà pourtant des interventions de hauts fonctionnaires de la République, j'insiste.

        Alors s'ensuit la quête du Graal, une saga qu'on peut résumer en quelques étapes. Le 16 mars 2005, le président de la République, Jacques Chirac, a convoqué à l'Élysée Renaud Donnedieu de Vabres et Jean-Noël Jeanneney pour concevoir et édifier une Bibliothèque « numérique » européenne afin de contrer les méfaits de l'entreprise californienne, soit « l'hégémonie culturelle mondiale des États-Unis pour les générations futures » ! selon les mots de Jeanneney. En pratique, on a mis en place un « contre-projet » où les oeuvres françaises de la Bibliothèque nationale — et exclusivement françaises —, déjà proposées par Gallica de la BNF vont prétendre contrebalancer le déséquilibre constitué par le projet de Google, grâce à la contribution de 19 Très Grandes Bibliothèques européennes, qui voudront bien faire de même, chacune pour sa langue et sa culture (entente du 27 avril 2005, doublée d'une sorte de « manifeste de Paris » le 3 mai). Le 30 septembre 2005, un communiqué de la Commission européenne de l'UE lancera... un appel de propositions sur la « numérisation et la consultation numérique » ouvert jusqu'au 20 janvier 2006 ! En juin 2006, la Commission sera alors en mesure de faire une « recommandation » dans le cadre du eContentplus Programme... Voilà pour la politique européenne.

        Ensuite, évidemment, le shérif a réussi à faire sortir de l'ombre tous les cowboys d'Amérique et, il faut bien le dire, cela n'était pas trop difficile. Michael Gorman, président des bibliothèques publiques états-uniennes, aurait manifesté sa très vive inquiétude vis-à-vis le projet de Google, après avoir pris connaissance des craintes du Grand Shérif français — d'après le shérif en question. L'Author Guild (AG) au nom des écrivains qu'elle représente, puis l'Association of American Publishers (AAP) (au nom de cinq groupes d'éditeurs : McCraw-Hill, Pearson Education, Penguin Group USA, Simon and Schuster et John Wiley and sons) ont donc intenté deux poursuites en septembre et octobre 2005 contre Google pour exiger... Devinez quoi ? Eh oui : des redevances, évidemment.

      Eh bien ! grâce à Google — au grand dam des cowboys européens qui se prenaient pour des shérifs —, ces capitalistes états-uniens vont accepter le 28 octobre 2008 un règlement tout simple qui devrait brasser environ 125 millions de dollars lors de sa mise en place. L'AG et l'AAP acceptent de retirer leur poursuite ridicule (comme la plupart des poursuites commerciales en justice, évidemment), contre une entente qui permettra au programme Recherche de livres d'afficher à l'écran jusqu'à 20% des pages d'un livre sous droits; ensuite, les utilisateurs pourront acheter le fichier scanné par Google, les profits étant partagés entre la compagnie et les auteurs et leurs éditeurs. À remarquer que c'est ce que se proposait Google depuis le début : relancer les livres épuisés, proposer aux auteurs et aux éditeurs de rejoindre à nouveau le public. Ces procès et procédures juridiques étaient prévus bien avant les toutes premières opérations matérielles à la bibliothèque de l'Université du Michigan, comme le prouvent les contrats passés avec les bibliothèques partenaires (Google s'engageait à défrayer tous les recours juridiques pouvant affecter ces universités). Dès que l'entente d'octobre 2008 sera entérinée par les tribunaux, Google mettra en place le registre où les auteurs et les éditeurs s'inscriront à ce programme.

      Mais revenons à l'Europe de nos cowboys.

Europeana (2007-2008), un Google miniature

      Au bout du compte, Europeana est mis en orbite le 22 mars 2007. C'est le prototype de la « Bibliothèque numérique européenne » réalisé par la BNF. Il s'agit du produit matériel promu, justifié et « théorisé » par le discours étatique de l'Élysée, celui de Renaud Donnedieu de Vabres et de Jean-Noël Jeanneney. Une copie conforme, en miniature, de Recherche de livres de Google. C'était vraiment risible, même si c'était en fait bien prévisible. Autrement dit, on fait ce que l'on peut, les informaticiens de France n'étant pas plus nonos que ceux des États-Unis, tandis que voilà des fonctionnaires et hommes d'État qui se permettaient de péter pas mal plus haut que le trou. Europeana, un modeste produit étatique, devait relever le « défi » de Google. Qu'on en juge.

      Il suffisait de se reporter au site d'Europeana pour se demander si l'on ne se trouvait pas sur celui de Google ! En miniature.

      La bibliothèque électronique comprennait 12 000 ouvrages de trois bibliothèques, les bibliothèques nationales de France, de Hongrie et du Portugal. Un bel effort, même s'il était dérisoire, s'agissant d'une entreprise étatique. Cela dit, tout comme Recherche de livres de Google, dont le corpus se comptait alors en centaine de milliers d'ouvrages, en millions avant longtemps, il ne s'agissait encore que d'un prototype. Or, ce qui frappait, c'était la ressemblance des deux bibliothèques électroniques, alors qu'Europeana venait après et en réaction à Google...

À ce moment, la questions n'était pas de savoir s'il fallait dédoubler les efforts, puisque la montagne de l'Élysée n'accouchait que d'une souris. On se demandait plutôt quand Recherche de livres de Google serait rattrapée par quelques concurrents quelque peu sérieux. Il était certes à l'honneur de Google d'avoir mis en place la première bibliothèque électronique dépassant le million (puis les quelques millions) d'ouvrages, mais combien de temps sera-t-elle restée la plus importante ? voilà la question.

      Sur Europeana (2007-2008), vous n'aviez pas la fonction recherche avancée qui permet de choisir le nombre d'ouvrages affichés par écran; en revanche, pour les résultats, vous en connaissiez la provenance (selon les trois bibliothèques), les dates par siècles, la langue et les auteurs, quatre facteurs calculés automatiquement (mais vous ne pouviez pas limiter votre recherche selon ces critères). Autrement, il n'y avait aucune différence sensible entre Recherche de livres de Google et Europeana, du point de vue du logiciel permettant d'interroger leur corpus. Sauf évidemment, il faut le répéter, qu'Europeana ne comptait que 12 000 ouvrages. Google, au moment de son lancement se proposait d'en scanner plus de 150 000 dans l'année en cours et son objectif était de franchir rapidement le cap du million de livres, ce qui a été très vite fait. Europeana et Google, ce n'était évidemment pas comparable, alors que précisément c'est le nombre qui fait la force d'une bibliothèque électronique.

Illustration des possibilités des bibliothèques électroniques

      Voici maintenant le petit exposé que je présentais en 2005. S'il était par trop optimiste, on le verra à l'analyse qui suit, en 2007, il illustre bien la nature et la portée des bibliothèques électroniques. Je marque de la parenthèse [?!] les données évidemment invraisemblables. Je n'avais manifestement pas lu mes « données ».


Novembre 2005

      Le site expérimental

Recherche de livres de Google — Beta.

est encore bien loin d'être la bibliothèque électronique qu'elle sera forcément avant longtemps. Mais j'imagine qu'elle peut déjà servir les chercheurs, même s'il n'est pas encore possible de programmer la recherche en fonction de la langue des ouvrages et qu'on ne peut pas non plus ordonner les résultats par ordre chronologique des ouvrages trouvés ou encore par ordre de fréquences des vocables et locutions recherchés, ordre croissant ou décroissant. En revanche, on peut déjà circonscrire sa recherche à une période donnée (par exemple, 1800-1899, pour limiter la recherche au XIXe siècle).

      Voici quelques exemples. Recherches effectuées les 11, 12 et 14 novembre 2005.

      La recherche sçavant OR sçavants OR sçavante OR sçavantes donne le résultat suivant : le mot se trouve au moins une fois sur 1 810 pages dans 114 livres. J'indique dorénavant, par raccourci, x pages de y livres. Le système ne distingue pas les minuscules et les majuscules. La recherche savant OR savants OR savante OR savantes conduit à 205 000 pages de 288 livres. Dans ce corpus, on devrait donc trouver le vocable savant dans environ 400 livres, mais curieusement, ils ne sont pas en majorité en français, comme on le verra (le vocable se trouvant souvent dans des citations).

      Son correspondant en anglais, learned, n'est pas univoque; la « forme » (car ce n'est pas un vocable comme savant) se trouve dans 2 590 000 pages de 189 livres [?! ouf !]. La recherche nous apprend que le système compte actuellement les pages au millier près, au-delà de mille occurrences.

Le vocable homme OR hommes = 1 300 000 pages de 49 livres [?! ouf !] ;
Le vocable femme OR femmes =    571 000 pages de 161 livres [?!].

— À lui seul, ce résultat est extrêmement significatif de la distribution des deux vocables de la langue française (même si plusieurs de ces livres ne sont pas en français) : il ne correspond pas à leurs fréquences relatives, mais du moins à leurs distributions dans le Français fondamental (Paris, Didier, 1964).

Le vocable man OR men = 42 100 000 pages de 205 livres [?! pour 42 100 ?];
Le vocable woman OR women = 12 600 000 de 231 livres.

Le vocable hombre OR hombres = 277 000 de 149 livres;
Le vocable mujer OR mujeres = 115 000 de 196 livres.

Le vocable uomo OR uomini = 199 000 de 235 livres.
— Malheureusement le féminin donna OR donne n'est pas univoque, correspondant à des mots français et anglais, dont deux formes de notre verbe donner.

Prenons alors le mot suivant univoque dans l'ordre alphabétique :

Le vocable doppio se trouve sur 14 200 pages de 239 livres.

      On peut conclure sur quelques expériences portant sur les vocables de hautes fréquences. Le système ne donne pas de réponse pour la recherche « le OR la OR les » ni « the »... heureusement peut-être ! En revanche, on trouve les deux résultats suivants :

Le pronom adjectif leur OR leurs = 1 380 000 dans 97 livres
La commande un OR une OR des = 14 300 000 pages dans 83 livres [?! pour 14 300 ?].

Cette dernière recherche ne correspond pas exactement à la fréquence de l'article indéfini (des est moins souvent le pluriel de l'article un que la contraction de + les). Mais peu importe. Comme il est impossible qu'un livre en français ne comprenne aucune occurence de l'article indéfini, sauf s'il est écrit par un Oulipien qui s'est donné cette consigne !, alors le corpus des livres de langue française de la banque devrait être d'environ 80 livres actuellement (novembre 2005).

      À suivre... On peut déjà rêver de ce que laisse entrevoir cette toute simple recherche sur un site encore à l'état expérimental.


Septembre 2007

      Malheureusement, le système de recherche de Google ne répond pas encore à ces espérances. Depuis quelques mois maintenant, les données statistiques ci-dessus sont manifestement infirmées. Non seulement je ne peux plus les confirmer, mais elles paraissent tout à fait inexactes.

      Bref, c'était trop beau pour être vrai.

      Je reprends donc l'exercice, en le simplifiant, sur quelques exemples privilégiés.

Homme/femme

L'Élaboration du français fondamental (Paris, Didier, 1964) :
— homme : fréquence = 131; répartition = 55; rang = 253;
— femme : fréquence = 275; répartition = 74; rang = 149.

      Voici le résultat de la recherche sur quelques bibliothèques électroniques, à partir des plus modestes et des plus sûres jusqu'aux plus vastes... et moins sûres.

Champion électronique : Corpus de la littérature narrative du Moyen Âge au XXe siècle : romans, contes, nouvelles, vol. 1 de la Base Internationale de Littérature Électronique, par Champion électronique et CNED. Corpus d'un millier de classiques de la littérature française. Le corpus peut être interrogé par deux logiciels, ARTFL Projet de Chicago ou Champion électronique.

Selon les deux logiciels, les résultats ne sont pas exactement les mêmes. Voici d'abord le résultat d'ensemble sur le serveur de Champion électronique :

homme/hommes = 64 186 occurrences dans au moins 728 documents;
femme/femmes = 47 951 occurrences dans au moins 674 documents.

Malheureusement, le logiciel d'ARTFL de Chicago, sur le même corpus, ne répond pas aux demandes qui dépassent 10 000 occurrences. Il faut donc prodécer par tranches (par siècles pour les 16-17, 18 et 20e; puis par tranches pour le XIXe siècle, 1800-1825, 1826-1835, etc.). Je calcule ensuite le total suivant :

homme(s) = 64 842 occurrences;
femme(s) = 49 051 occurrences.

Je trouve par la même occasion que la distribution du vocable varie selon les siècles et les genres : pour la période 1876-1890, on obtient les résultats suivants (avec le logiciel de l'ARTFL de Chicago, je le rappelle) :

— homme/hommes = 6 051 occurrences de 297 documents;
— femme/femmes = 6 740 occurrences de 297 documents;

dans les romans de Zola :
— homme/hommes = 2 745 occurrences dans 10 documents;
— femme/femmes = 3 208 occurrences dans 10 documents.

dans les romans de Proust :
— homme/hommes = 1 520 occurrences dans 7 documents;
— femme/femmes = 2 030 occurrences dans 7 documents.

ARTLF Projet de l'Université de Chicago constitue actuellement un corpus de 2 600 ouvrages. En proportion, les résultats correspondent au corpus de Champion électronique :

— homme/hommes = 327 625 occurrences;
— femme/femmes = 151 952 occurrences.

dans les romans de Zola :
— homme/hommes = 5 140 occurrences;
— femme/femmes = 5 380 occurrences.

dans les romans de Proust :
— homme/hommes = 1 523 occurrences;
— femme/femmes = 2 380 occurrences.

Recherche de livres de Google (16 août 2007) :
— homme OR hommes = 56 000 occurrences dans 374 ouvrages;
— femme OR femmes = 53 300 occurrences dans 570 ouvrages.

      Mais malheureusement, ces données ne sont pas produites par le logiciel, mais doivent être déduites en fonction des résultats selon les écrans. Avec ces déductions, on obtient les résultats suivants :
— man OR men = 4 300 600 dans 459 ouvrages;
— woman OR women = 2 540 600 dans 469 ouvrages;
— hombre OR hombres = 29 300 dans 577 ouvrages;
— mujer OR mujeres = 22 800 dans 529 ouvrages.
      Ces statistiques ne concordent pas avec les données obtenues en novembre 2005. Cela dit, si je lance un mot de basse fréquence, Jogues, je trouve 1 158 occurrences dans 343 livres, dont le second volume de ma série des Saints Martyrs canadiens consacré au missionnaire en deuxième position, après Novum Belgium de Jogues, paru chez Cramoisy-New York en 1862. Suit la biographie du missionnaire par Félix Martin en 1873 et ensuite par celle de Francis Talbot en 1935. Ce résultat est vraiment remarquable, du point de vue bibliographique, même si j'aurais bien aimé figurer en première place ! d'autant que j'ai rédigé cinq ouvrages sur les Saints Martyrs canadiens.

Europeana, Bibliothèque numérique européenne.

      Catastrophe ! Jogues est confondu avec Jogú et on se retrouve avec 19 ouvrages, 15 ouvrages français, dont le premier est de Rémy de Gourmont, 1861, qui vole la vedette avec les Français au Canada et en Acadie, suivi de Chateaubriand, quatre fois ses oeuvres complètes, avec 2 ou 3 occurrences de notre bon Isaac Jogues ici ou là...

— homme = 6 924 ouvrages;
— femme = 6 552 ouvrages.

La recherche homme donne les mêmes résultats que hommes (pluriel), mais il faut dire que la recherche de mot y est très approximative. Vous lancez homais et vous vous retrouvez avec Home, homme, l'homme, etc. En plus, on compte les vocables des titres courants ! Bref, le logiciel d'Europeana n'est manifestement pas au point. En plus, le critère de classement des ouvrages ou leur pertinence (représentée par un petit graphique et un pourcentage) ne sont pas très clairs pour moi. Bien entendu, on comprend que ce n'est là qu'un prototype et c'est le mieux qu'on puisse dire.

      Il me semble que toute la question est là. La BNF pourrait partager son corpus avec Recherche de livres de Google (sans exclusive, évidemment, comme c'est le cas des partenaires de la compagnie). Elle établirait évidemment ce corpus, puisqu'il s'agit de ses ouvrages. En revanche, elle pourrait mettre au point son propre système de recherche pour les ouvrages de son fonds. Bien sûr, elle partirait de loin, comme on vient de le voir. Toutefois, sa bibliothèque électronique se compterait très vite en centaine de milliers d'ouvrages. Pourquoi donc se priverait-elle de Google ?

Europeana (2008-2011), un portail des bibliothèques et des musées européens, dont Gallica 2 de la BNF

      En effet ! La question ne se pose plus aujourd'hui. La Bibliothèque nationale de France, comme celle du Québec, s'est privée jusqu'ici du formidable projet de Google. On peut toujours rêver d'un retour vers le futur, mais ce sera forcément longtemps de l'ordre de la rêverie.

      Cela dit, la question d'une bibliothèque électronique européenne ou française ne se pose plus non plus. Europeana a déclaré forfait en janvier 2008. La République a passé la main en douce, d'une part en laissant le nom fabuleux d'« europeana » à la Bibliothèque européenne (European Library), mise en place depuis les années 2000, sur la toile depuis le 17 mars 2005, et relancée sous le nom d'europeana le 20 novembre 2008 (en réalité, elle a été fermée le lendemain et réouverte le 27 décembre). Il s'agit d'un portail des bibliothèques et des musées d'Europe, avec quelques fonds d'archives d'État, redirigeant les utilisateurs vers les institutions d'origine. Indexant deux millions de fichiers actuellement, six en 2011, Europeana (situé à La Haye aux Pays-Bas) regroupe des institutions de 27 pays, comptant 22 langues. Cela dit, il s'agit évidemment d'une collection virtuelle et non d'une bibliothèque électronique. Qu'on en juge :

Europeana, Bibliothèque européenne
< www.europeana.eu >

Comme on le voit, Europeana et Recherche de livres ne se comparent pas, à commencer par le fait tout simple que le programme de Google interroge plus de sept millions de livres, ce qui donne prise sur toutes les langues de tous les pays du monde occidental (pour l'instant).

      Ensuite, en revanche, en conséquence, la Bibliothèque nationale de France s'est remise à s'occuper de ses affaires au lieu de se mêler de celles des autres. C'est Gallica 2, la seconde phase de la bibliothèque virtuelle. L'opération consiste à scanner 100 000 livres par an durant trois ans, de 2008 à 2011. Le projet n'a plus rien à voir avec un Google miniature, mais au contraire avec une démultiplication de la bibliothèque Gallica qu'on a connue et appréciée jusqu'ici.

      En plus, il apparaît qu'avec cette seconde phase de son développement, Gallica pourra rapidement devenir une bibliothèque électronique. Je pense qu'elle devrait être un complément important de la machine Google, aussi précis que les données du TLF, qui lui ont d'ailleurs servi d'embryon. Si vous lancez maintenant (19 janvier 2007) la recherche « Maldoror ET Holzer », en restraignant la recherche aux ouvrages de langue française, vous trouvez quatre livres sur Gallica 2 et 101, sur la Recherche de livres de Google. La disproportion est évidente et ne peut être renversée. Et par malheur, dans les Chants de Maldoror, vous ne trouvez qu'une seule des deux occurrences du nom Holzer sur Gallica. Pourtant, il ne fait pas de doute que Gallica devrait avant longtemps servir, par sa précision, à corroborer et à valider sur son précieux petit corpus soigné les données brutes obtenues grâce au système de Google.


Sources et documents

Pour commencer, je reproduis et commente, à l'appui de mon analyse, le « point de vue » du ministre de la culture et de la communication de la République de France, paru dans le Monde le 18 mars 2005 (51), ainsi que le communiqué de presse du Syndicat national de l'édition (SNE) de la République (2006). Entre ces deux documents, je propose une analyse critique du livre de Jean-Noël Jeanneney, président de la Bibliothèque Nationale de France (52).


Google n'est pas la fin de l'histoire

Renaud Donnedieu de Vabres
Ministre de la culture et de la communication
République française

      Il y a quelques semaines éclatait, comme un coup de tonnerre dans le ciel numérique (a), l'annonce qu'un serveur américain puissant, efficace, populaire, allait numériser et proposer en ligne 15 millions de livres provenant du patrimoine conservé par quelques-unes des plus prestigieuses bibliothèques anglo-saxonnes.

      L'événement intervient dans un climat intellectuel et culturel où la numérisation des documents et des oeuvres apparaît comme la clef de tous les problèmes. Celui de l'accès aux oeuvres, que la numérisation rendrait aisé, agréable, libre et, de préférence, gratuit (b). Celui de la fréquentation des bibliothèques, qui trouveraient de nouveaux publics et de nouvelles missions à travers la diffusion numérique. Bref, tel Francis Fukuyama prophétisant bien imprudemment, après Alexandre Kojève, « la fin de l'histoire », les nouveaux oracles de la numérisation (c) auraient trouvé, grâce à Google, l'aboutissement utopique de tant d'années d'efforts, de recherche et... de politique culturelle (d).

      La présence des oeuvres sur les réseaux numériques est un enjeu fondamental et une priorité du ministère de la culture et de la communication. Chacun de ses grands domaines d'intervention — le patrimoine, l'architecture, les archives, les musées, les arts plastiques, la musique, le livre, l'audiovisuel — y consacre des moyens importants, avec la volonté de proposer des collections numériques sélectionnées, cohérentes, signifiantes, repérables, en conciliant exigences scientifiques (e) et souci de présentation au plus large public.

      La base Joconde, qui recense 178 000 oeuvres des collections de nos musées, accessible à tous sur Internet, en est une bonne illustration. Le plan de numérisation de la presse du XIXe siècle, engagé par la BNF, en est une autre. Je tiens à mentionner aussi la base « enluminures », avec ses 80 000 images tirées des manuscrits médiévaux, conçue avec le CNRS et toutes les villes où ces trésors sont déposés.

      Ces collections sont le fruit non d'une numérisation de masse (f), mais, chaque fois, d'une politique documentaire pensée, réfléchie en fonction de l'existant et des besoins croisés de la recherche, de la quête de culture de chacun, et de la conservation.

      Il ne faut pas sous-estimer les difficultés techniques, financières et intellectuelles d'un tel chantier (g) : numériser des livres et des périodiques anciens sans les détériorer est une tâche longue, chère et difficile (h). Ce travail ne sert à rien s'il ne s'accompagne parallèlement d'un travail de signalement, de description et d'indexation des documents, qui permettra de les reconnaître et de les repérer dans les outils bibliographiques qui devront accompagner les textes (i).

      Au-delà de la numérisation, Internet, avec les moteurs de recherche, inaugure une nouvelle forme d'accès au savoir. Nous avons probablement à apprendre de Google, dont le succès vient largement de sa simplicité et de sa facilité d'accès (j). Si la plupart des collections numérisées du ministère sont accessibles sur le Web — comme le service Gallica de la BNF (k) —, nous devons en améliorer la cohérence. C'est la vocation du portail culture.fr, dédié aux événements et aux sites culturels. Demain (l), il sera le portail d'accès à nos collections numérisées.

      Tels sont mes choix. Telle est la politique que j'encourage, au ministère et dans les établissements qui en dépendent, grâce aux crédits de mon budget consacrés à la numérisation : plus de 15 millions d'euros par an, en plus du personnel qui s'y consacre (m).

      L'accès direct et automatique au savoir (n) permis par les moteurs de recherche ne saurait ni être exclusif ni remettre en cause le rôle essentiel, dans la culture et l'éducation, des médiateurs et des passeurs. Je ne crois pas que la seule clef d'accès à notre culture soit le classement automatique par la popularité, qui a fait le succès de Google (o).

      Au moment où l'on célèbre à si juste titre la mémoire de Foucault, de Sartre et de tant d'autres penseurs de notre modernité (p), j'ai presque de la gêne à rappeler que le savoir déposé dans les bibliothèques ne se livre pas de lui-même. Dans son épaisseur, sa densité, sa complexité, il fait écran à lui-même. Il faut fouiller, exhumer, reconstituer, hiérarchiser (q).

      C'est le travail du chercheur. Cette « archéologie du savoir », cette production d'oeuvres sur les oeuvres sont l'indispensable médiation sans laquelle les formations intellectuelles et culturelles du passé nous resteraient inaccessibles. C'est aussi le sens de l'action du ministère qui crée, y compris sur Internet, des « parcours » dans les collections, des expositions virtuelles, afin de guider l'utilisateur dans toute la richesse et la diversité de notre patrimoine (r).

      Enfin, le numérique ne saurait prétendre déployer le savoir au mépris des conditions de production de ce savoir. Tel est le sens du projet de loi sur le droit d'auteur dans la société de l'information que le gouvernement présentera bientôt au Parlement. Tel est celui de mon combat pour l'accès aux oeuvres légalement sur l'Internet (s).

      Oui, j'affirme, à côté de la modernité du numérique, la non moins vivante modernité du lien (t), qu'il soit de nature sociale, économique, intellectuelle ou culturelle. C'est par elle que nous ne sommes pas seulement des consommateurs d'une information « organisée » par d'autres (u), mais que nous participons à la culture, comme des volontés coresponsables de la production, de la compréhension, de la vie et de la transmission d'une oeuvre (v).

      Renaud Donnedieu de Vabres est ministre de la culture et de la communication. Article paru dans le Monde le 18 mars 2005


Commentaires critiques
du point de vue de M. Donnedieu de Vabres

(a) Voyons donc ! On peut oublier, d'accord, le Paradis des drôles de numéros, le ciel des étoiles numériques, mais certainement pas le coup de tonnerre diabolique. Le projet de Google était connu depuis plusieurs années et se trouvait déjà à l'épreuve sur Google, qui pouvait renvoyer à de très nombreuses « quatrièmes de couverture » et à de nombreux sommaires. Le ministre vient tout simplement d'apprendre qu'il y a trois mois que cinq grandes bibliothèques s'associent à Google. Pour nous tous, ce n'est qu'une heureuse étape d'un projet en cours que le ministre paraît découvrir. Incidemment, il faut insister, cet exposé, qui découle de la pensée du président de la BNF, est méprisant pour les responsables des cinq bibliothèques qui se sont associées à Google, responsables qui ne sont certainement pas des incompétents.

(b) Non, monsieur le ministre, une bibliothèque électronique n'est rien de cela. Vos fonctionnaires, ou plutôt les fonctionnaires de la Bibliothèque Nationale de France, vous ont certes ainsi présenté les choses, par la voix du président Jean-Noël Jeanneney. C'est tout à fait inexact. Il ne s'agit nullement d'« accéder » aux oeuvres de « manière libre, etc. ». Votre énumération montre que vous n'avez aucune idée de la nature d'une bibliothèque électronique, dont le premier et principal objectif est de permettre la consultation et la manipulation de très vastes corpus (recherche de mots, de citations, de sources et de passages, cooccurrences de vocables, locutions et tournures syntaxiques, chaînes étymologiques et familles de mots, index de noms propres, etc.).

(c) Francis Fukuyama, Alexandre Kojève : vos lectures, monsieur le ministre, comme on le voit au titre de votre article qui en découle, vous font honneur, mais je vois bien mal ce que ces penseurs viennent faire aussi abruptement dans votre exposé, puisque personne n'a rien prophétisé. Pas d'oracles dans le paysage. Je me permets de vous rappeler que ce ne sont pas vos apocalypsologues Fukuyama et Kojève, mais Larry Page et Sergei Brin qui ont fondé la compagnie Google et que c'est Adam Smith qui gère le projet de Google. Mais non ! monsieur le ministre, un autre Adam Smith, mais je dois dire que vous être maintenant plus proche de la réalité. Oui, pas un prophète, mais un capitaliste, qui sait fort bien que Google n'est pas « la fin de l'histoire », ce qui est une affirmation vraiment ridicule en l'occurrence, puisque c'est le début de sa fortune !

(d) Si l'on vous comprend bien, vous affirmez que le projet de Google ne saurait être l'aboutissement de votre « politique culturelle ». Évidemment, car je ne pense pas que le projet Google ait pu compter sur la collaboration de la Bibliothèque Nationale de France. Est-ce que vous voudriez sérieusement dire ce que vous affirmez, à savoir que vos projets sont tellement grandioses qu'ils sont franchement utopiques et que ce n'est tout de même pas la réalisation du projet de Google qui y mettrait fin, puisqu'ils sont... irréalisables ? C'est pourtant ce que vous dites et... ce qui risque fort de se produire.

(e) Pourquoi énumérer ces attributs ? Les collections nationales sont « sélectionnées, cohérentes, signifiantes, repérables, en conciliant exigences scientifiques » ? Bravo. Non seulement on ne demande rien de cela à une bibliothèque électronique, mais on ne veut pas de sélection du tout : on veut tout, tout ce qu'il est possible d'y mettre le plus vite possible, de telle sorte que ces attributs ne sauraient s'appliquer. Le ministre reprend le raisonnement de ses fonctionnaires bibliothécaires qui, eux, doivent choisir, étant donné les coûts et les espaces qui sont forcément comptés. Une bibliothèque électronique n'a que faire de sélections, de cohérence, de signifiance, de références et de ce qu'on appelle des « exigences scientifiques ». Cela dit, si ces attributs ne définissent en rien une bibliothèque électronique, il est présomptueux de laisser entendre qu'ils ne s'appliquent pas aux résultats du projet de Google... Ce serait même de la diffamation, étant donné les résultats actuellement accessibles.

(f) Quelle injure ! Or elle est injuste. Vous nous dites que vos collections Joconde et Enluminures présentent 250 000 oeuvres soigneusement choisies. Mais à partir du moment où vous pouvez, dans une première période de quelques années seulement, en offrir dix fois plus, deux millions et demi, la question du choix ne se pose plus du tout de la même manière : on choisit alors toutes, oui, toutes les oeuvres qui peuvent être traitées vite et en grand nombre. Je comprends, bien sûr, que votre objectif est de dénigrer le projet de Google en faisant l'apologie de vos collections, car autrement on verrait mal comment vous pourriez vous réjouir que Joconde et Enluminures ne soient pas le « fruit d'une numérisation de masse » ! Une numération (sic) d'élite, peut-être ? Ou choisie par l'élite, vous et vos savants ? Élitiste, alors. Mais passons outre, car on a compris.

(g) De quoi je me mêle ? Il me semble, monsieur le ministre, que vous avez assez de pain sur la planche avec Gallica sans vous mêler du chantier de Google.

(h) Faux. Il n'est pas « long, cher et difficile » de scanner les documents « anciens ». Il n'est pas du tout difficile, il est seulement plus long de traiter les documents fragiles (fragiles, et non anciens). Et franchement, nous n'en sommes pas encore à la question des ouvrages des Grandes Réserves. Est-ce que monsieur Jeanneney n'aurait pas pu expliquer cela au ministre ?

(i) Travail enfantin. Google le réussit actuellement parfaitement bien.

(j) Changement de sujet : le système de recherche Google n'a absolument rien à faire ici, puisque depuis de début c'est le projet Recherche de livres de Google qui est dénigré sans vergogne.

(k) C'est la première fois que le ministre nomme Gallica. Pourtant, nous ne sommes pas dupes : c'est Gallica contre Google ! Il s'agit d'une piètre tentative de noyer le poisson, y mêlant de la Joconde et de l'Enluminure...

(l) Bravo !

(m) On sait lire. Jusqu'ici, on a lu une critique virtuelle du projet de Google, sous la forme d'une vague et abstraite apologie des « réalisations » de la République française. Pas la moindre proposition de « choix » du ministre, ni de « politique » du Ministère de la culture et des communications. Mais en ce qui concerne le budget, si 15 millions d'euros faisaient 30 millions de dollars, alors en cinq ans ce serait le budget du projet de Google. Questions : ce budget n'est-il pas trop modeste, s'agissant de celui d'un État ? Et si les États européens se regroupent pour en mettre dix ou quinze fois plus, qui du consortium étatique européen ou de la petite compagnie californienne sera le plus efficace ? En tout cas, monsieur le ministre et son président de la Bibliothèque nationale dépensent déjà beaucoup de temps et d'énergie à dénigrer un projet qui ne les concernent nullement...

(n) Confondre la consultation électronique avec le « savoir » est tout de même surprenant.

(o) Quelles confusions. Mêler la consultation électronique, le système de recherche Google et le projet Recherche de livres de Google, c'est vraiment à croire que les apocalypsologues Fukuyama et Kojève n'avaient pas tort de voir dans Google la fin de l'histoire. Google ne donne pas accès automatique et direct au savoir ? Alors changez de système de recherche. Moi, je vous le dis franchement, je n'utilise pas Google, mais Altavista, car lui donne un accès automatique et direct au savoir.

(p) Après Fukuyama et Kojève, Foucault et Sartre. Il faut s'attendre au pire.

(q) Je m'en doutais ! Monsieur Renaud Donnedieu de Vabres est très gêné d'avoir à écrire que consulter ne suffit pas, qu'il faut aussi lire. Ah ! misère... N'y aurait-il personne à la Bibliothèque Nationale de France pour expliquer au ministre quelle différence nous faisons tous entre la bibliothèque électronique ou virtuelle et leur bibliothèque d'encre et de papier ? Mais en lisant la suite, vous comprendrez vite que l'auteur du point de vue ne traite plus du tout de son sujet. On est maintenant dans le discours clérical pur, le sermon culturel qui sert à montrer que ce qui a été dit doit être juste, puisque cela a été exposé par un homme qui écrit si bien. C'est l'éloquence ministérielle.

(r) C'est précisément l'élitisme qu'il faut dénoncer. Monsieur le ministre et ses fonctionnaires se proposent de guider les citoyens.

(s) Après le cowboy, voici le shérif. Avec promesse d'utiliser l'arme de destruction massive : une nouvelle Loi du droit d'auteur. « Son combat », « légalement », etc. « Le numérique ne saurait prétendre déployer le savoir au mépris des conditions de production de ce savoir ». Au cas où ce ne serait pas clair pour tous, traduisons : « il faut payer », « il faudra payer ». Et, sous-entendu, le cowboy est assez combatif : « attention : non seulement Google risque de faire des profits avec la publicité dans sa bibliothèque électronique, mais est-ce que la compagnie va payer des droits d'auteurs aux éditeurs et aux administrateurs de sociétés de gestion ? ».

(t) Il doit y avoir ici une faute syntaxique ou typographique, car je ne pense pas que la phrase soit française. Qu'est-ce donc qu'un « lien », employé ainsi absolument ? Tout le reste me paraît d'ailleurs illisible, même si on comprend très bien le sens de l'éloquence ministérielle.

(u) Les autres, ce sont Adam Smith et les employés du projet de Google. Avec cette dernière pointe, on voit que le ministre n'a pas oublié son sujet. Or, justement, lui veut nous « organiser », on l'a vu (f), pas les responsables de Google.

(v) Après la dernière pointe, c'est vraiment une belle finale. Nous « participons à la culture, comme des volontés coresponsables de la production, de la compréhension, de la vie et de la transmission d'une oeuvre ». Bravo, applaudissements. Voyons donc. Qu'est-ce que cela peut signifier dans le combat contre le projet de Google ? — Qu'on trouve là de dangereux irresponsables sans culture qui méprisent les oeuvres ? Si la phrase pouvait avoir un autre sens, j'en serais fort aise. Mais cela ne me paraît pas possible. L'auteur exprime clairement pour finir le fond de sa pensée, « moteur de recherche » de sa thèse et de son exposé.


Jean-Noël Jeanneney, Quand Google défie l'Europe

Jean-Noël Jeanneney, Quand Google défie l'Europe : plaidoyer pour un sursaut, Paris, Fayard sous le nom de « Mille et une nuits », 2005, 114 p. Le texte est daté des 6 au 29 mars 2005 (p. 110).

      Ce texte restera forcément dans les archives de l'histoire et c'est bien dommage pour le sympathique Jean-Noël Jeanneney. On ne trouve pas souvent, en effet, des ouvrages qui expriment aussi simplement et crûment les opinions de leurs auteurs, aussi franchement insupportables peuvent-elles être. Il est très rare, en particulier, que le racisme s'affiche, même sous forme édulcorée de chauvinisme ou de patriotisme. Par ailleurs, les arguments de l'auteur pourraient être pris en considération, évidemment, s'il ne s'agissait non seulement d'arguments d'autorité, mais pour bien dire d'arguments d'État. Il n'y a absolument aucune raison, c'est le cas de le dire, de prendre en considération des « arguments » qui sont en fait, en réalité des décisions d'entreprises. Qu'à l'inverse, la BNF décide de produire une bibliothèque électronique, voire un système de recherche pour rivaliser avec Google, voilà qui serait formidable. Mais, écrivons-le entre guillemets : « bonne chance, mon vieux ! », car la France n'est certainement pas aussi efficace que les entreprises privées en la matière.

      Disons d'abord que ce texte du président de la Bibliothèque Nationale de France n'est pas en accès libre sur la toile. Vous devez l'acheter aux éditions Fayard. Il est donc « sous droit ». Car j'aurais beaucoup aimé en reproduire ici de très larges extraits pour les commenter mot à mot. Pourquoi pas ? Ne s'agit-il pas d'un document d'État ?

      Ensuite, et c'est d'ailleurs le seul et unique bon point que j'accorde à Jean-Noël Jeanneney, très important, toutefois : voilà un haut fonctionnaire de l'État qui est un intellectuel n'hésitant pas à s'exprimer publiquement dans le cadre de ses fonctions. Cela est tellement rare et précieux que jamais d'aucune manière je ne m'en prendrais à son livre si je n'y étais forcé à cause de son sujet. D'ailleurs, je dois dire que c'est à l'honneur de la France que ses hommes politiques et ses hauts fonctionnaires ne se privent pas du droit de parole qui leur appartient, tout autant qu'à tout citoyen. En revanche, c'est le revers de la médaille, ce droit de parole implique forcément le droit de réplique de tous, ce qui justement n'est pas très français, malheureusement. Je n'ai encore rien lu dans la presse française de ce que l'on lira ici, qui coule pourtant de source. — Et mon expérience n'est pas très positive sur cette question : j'ai déjà eu droit à une mise en demeure tout ce qu'il y a de plus juridique du président de l'IMEC pour être tout simplement intervenu contre une de ses décisions... juridiques, je le rappelle, s'agissant du « moteur » du présent répertoire.

      Qu'est-ce donc que cet ouvrage ? Ce n'est ni un traité, ni un essai. C'est un discours. Un discours politique. Le personnage, c'est la règle du genre, n'a rien à dire, aucun fait à rapporter, mais simplement à exposer des idées et des opinions qui, à son avis, devraient défendre un projet. C'est tout. En fait, non, ce n'est pas tout, car les idées et opinions de l'orateur, qui n'ont pas à être justifiées, donnent lieu à toutes les dérives.

      En effet, ce discours informel d'une centaine de pages, daté des 6 au 29 mars 2005, est non seulement délirant, mais injurieux. Il est délirant, car son auteur, manifestement, n'est pas bien informé de ce dont il parle, Google Print dont il ne connaît pas les éléments fondamentaux (et en cela, il est mal informé par ceux qu'il sert et qui produiront Europeana (2007-2008), c'est évident, une copie conforme de Recherche de livres de Google); il est injurieux pour son discours anti-états-unien entièrement construit sur la dénonciation sans fondement d'une entreprise privée, Google.

      On ne peut pas dire que ce discours soit structuré. Il est toutefois organisé sur une dérive qui consiste à développer un virulent sentiment anti-états-unien, pour ensuite s'en défendre, en proposant un plaidoyer assez informel pour une bibliothèque électronique européenne. On a lu et analysé une à une ces idées plus haut, dans le texte du ministre Renaud Donnedieu de Vabres, et il n'y a pas de raison d'y revenir : c'est la hiérarchisation en fonction d'un prétendu algorithme publicitaire, le vrac, la mainmise de la culture anglo-saxonne, le fait qu'on soit à la merci d'une compagnie privée, la nécessité de l'ordre étatique paternaliste pour éclairer les choix des citoyens, etc. Bref, ce n'est pas la fable des raisins qui sont trop verts, mais celle de ceux qui ne sont pas encore assez mûrs.

      En revanche, la rhétorique du mépris doit être dénoncée. On appellera cela la rhétorique de l'Élysée. Ainsi, Jeanneney aurait condamné « d'emblée, et vertement », dit-il, « tous ceux qui voulaient voir dans mes propos je ne sais quelle hostilité à Google » (p. 32). Et voilà ! On s'embrasse. Quelle hypocrisie que cette rhétorique de l'Élysée.

      En fait, il n'y avait aucun discours à tenir, aucun livre à écrire : « Il serait injuste de faire à Google comme à ses rivaux mineurs un procès d'intention en les taxant d'hypocrisie et de perversité. Ils jouent leur jeu, celui du milieu économique où ils prospèrent, celui de la technologie qu'ils développent, celui du pays où ils baignent » (p. 104). Sauf pour ces tout derniers mots, où le mépris est évident, tout le reste est si juste qu'on ne peut comprendre l'objet du livre. Question : eh oh! Jeanneney, pourquoi alors faites-vous un procès d'intention aux politiques de Google en les taxant d'hypocrites et de perverses, d'impérialistes, page après page ? Attention, c'est vous qui parlez d'hypocrisie et de perversité, pas nous.

      Cela commence pourtant par le titre du livre de Jean-Noël Jeanneney. Quand Google défie l'Europe serait en fait un titre complètement faux qu'il faudrait lire Google, un défi pour l'Europe. Je vous jure. Il faut dire que lorsque tu intitules une de tes sections du sous-titre « Bibliothécaires et libraires : un besoin d'eux », il n'est pas certain que tu écrives correctement le français, mais il y a tout de même des limites à ne pas savoir quel titre on donne à son ouvrage et quel en est le sens. Le pauvre homme a découvert que le verbe défier devait être traduit en anglais non pas par le nom defy, mais par challenge. Mais alors, pourquoi ne l'écrivait-il pas en français, dans le titre de son ouvrage ? Tout simplement parce que nous sommes ici dans la rhétorique de l'Élysée. Elle consiste à prendre la seconde moitié de l'ouvrage pour affirmer haut et fort que ce qu'on lit dans la première moitié n'a rien à voir avec ses bonnes intentions et en conclusion que le titre du livre n'est pas celui qui est écrit sur la page de couverture, mais un autre, Google, un défi pour l'Europe. Quel nono, cet éditeur, qui n'a pas mis le bon titre.

      Les Américains (c'est ainsi que sont désignés les États-uniens) sont de dangereux impérialistes. « Impérialisme », oui, qui « risque de s'imposer aux dépens de l'héritage de siècles de sages réflexions » (p. 11); « effet de domination, avec cette arrogance plus ou moins consciente qui en résulte » (p. 15). Bref, ce sera la domination de l'anglais (p. 60), (« sous sa forme américaine », sic, p. 13, dans son « idiome simplifié » comparable au « grec abâtardi », p. 61; alors que tout de suite après, il est question du « parler anglo-américain »), ailleurs de la domination de la culture anglo-saxonne et de Wall Street (p. 84). Franchement...

      Les Européens (ce sont les Français, investis d'une mission civilisatrice) ont le devoir de répliquer à l'impérialisme ! Il s'agit de « notre civilisation », je vous jure, contre la « civilisation » « américaine » (p. 15, 49, 57, 105). Il faut réagir contre la « brutalité d'une uniformisation » (p. 52), aux « forces obscurantistes qui sont au travail » (p. 53).

      — Sans compter que nous sommes ici confrontés au cigare de Bill Clinton dans l'affaire toute mouillée de Monica, toute une affaire (p. 48), et à la fameuse intervention de Condolezza Rice à Science Po (sic) le 8 février 2005 (p. 54). Jean-Noël Jeanneney y était. Notre champion se demande donc longuement et sérieusement si les Français, la France, voire l'Europe ne devraient pas réinventer un « moteur » de recherche susceptible de planter Google.

      Google, c'est les États-Unis. « Le capitalisme américain tel qu'il fonctionne et dans la société américaine telle qu'elle se conçoit » (p. 56). Ces capitalistes ont négocié des contrats « en grand secret » (p. 8), notamment avec ces infects Roast-Beafs Britanniques (la Bodleian d'Oxford !, p. 8-9), « solidarité anglo-saxonne qui nous est familière », de la part d'un pays propre « à regarder vers le grand large plutôt qu'à se tourner vers le continent en quête de patriotisme européen de notre aventure en marche » (p. 9, textuel, je vous jure). La compagnie se livre à une procédure que, dit-il, « j'allais dire maligne » (p. 41) : grosse entreprise, populisme culturel, hiérarchie publicitaire, hyperpuissance (oui, oui, Google), hégémonie américaine, etc.

      Google, en plus, a un employé du nom fameux d'Adam Smith, on l'a vu. Comme on sait, l'économiste croyait aveuglément, dit-on, aux lois du marché. Tel n'est pas le cas des citoyens de la République et de l'Europe. Oui, je sais, je deviens grossier et vous ne pensez pas que monsieur Jean-Noël Jeanneney puisse se livrer à un tel amalgame par le biais d'un jeu de mot sur un nom propre. Alors je le cite au texte, honte à lui : « J'ai souri en notant qu'un des membres de l'équipe dirigeante de Google répondait au nom d'Adam Smith : homonyme du célèbre économiste anglais, inventeur au XVIIIe siècle de la théorie de la main invisible. [...] Nous n'avons pas ces convictions-là. L'Europe, dans son ensemble, ne fait pas cet acte de foi » (p. 34-35). Suivent trois pages contre « le libéralisme américain à la mode de l'école de Chicago » (p. 36), c'est-à-dire Smith, Google et les États-Unis. Nous sommes ici et depuis longtemps en plein délire, évidemment.

      Si l'on en vient à l'essentiel, on se retrouve avec l'annonce faite à Jean-Noël Jeanneney — l'annonce faite à Marie, au Monde (p. 9) et à la planète (p. 56) —, en décembre 2004. Et le voilà à s'énerver le poil des jambes, alors que le projet de Google est connu depuis longtemps. Mais voilà aussi pour lui l'occasion, sans le savoir, d'exprimer son plus parfait mépris pour la « civilisation » qu'il appelle « américaine ». Cela s'appelle, je crois, dépasser les bornes.

      — On trouve, à quelques endroits stratégiques de son discours, de très précises évocations du « respect des droits des auteurs et des éditeurs » (p. 9), « droits des auteurs et des traducteurs » (p. 102), la « crainte compréhensible des éditeurs d'être par là spoliés » (ibid.). Mais le président de la Bibliothèque nationale n'avait pas besoin d'en rajouter : le Groupe de La Martinière sait qu'il pourra compter sur son appui contre Google.


Syndicat national de l'édition
de la République française

Communiqué de presse

Le Syndicat national de l'édition a décidé, au nom de la défense des intérêts de ses adhérents (1), de s'associer à l'action en contrefaçon engagée par le Groupe La Martinière (2) contre le moteur de recherche (3) américain (4) Google qui a numérisé (5) massivement (6) et mis à la disposition du public sur le réseau Internet (7), sans autorisation préalable, une partie des fonds des éditeurs français (8).

Le SNE a, depuis le mois de janvier 2006, dénoncé publiquement de tels agissements qui contreviennent aux règles essentielles du droit de la propriété intellectuelle (9).

Le Syndicat national de l'édition
Paris, le 7 juin 2006

115, boulevard Saint-Germain, 75006 Paris
Téléphone : 01 44 41 40 50 —
Télécopieur : 01 44 41 40 77


(1) C'est clair. Ce ne sont pas nos intérêts, ceux des lecteurs, ce ne sont pas les intérêts de la société. Ce sont les intérêts corporatistes des « adhérents ». C'est beau, la clarté.

(2) Ce groupe est le propriétaire des Éditions du Seuil, Paris, dont nous avons tous acheté des dizaines de livres. La maison de la rue Jacob. Quelle misère. Ainsi, ce sera plus clair : dans ma famille, on dit, nourrissez un cochon, il viendra chier sur votre perron.

(3) Système de recherche. Moteur de recherche : je me demande toujours ce que viens faire l'idée de « moteur » là-dedans. C'est pas clair...

(4) Américain pour états-unien et, ça, c'est vraiment clair : en France, on ne sait pas encore que l'Amérique, c'est vaste ! En Amérique du nord, les Mexicains, les États-uniens, les Canadiens et les Québécois sont des Américains. Je veux bien croire que Google a son siège social en Californie, mais ce n'est pas une raison pour le qualifier d'« américain ». Tiens ! Le SNE, le syndicat européen...

(5) Numérisé, pour digitaliser, c'est scanner.

(6) Massivement, vraiment ? C'est pas clair...

(7) Totalement faux et même complètement loufoque. On le voit clairement en consultant le serveur Recherche de livres de Google.

(8) Le syndicat européen (je m'amuse !) parle-t-il au nom de ses adhérents ou de la République française ? Il faudrait donc lire « une partie des fonds des Éditions du Seuil, prétend son propriétaire, et de nos autres adhérents », n'est-ce pas ? Sinon, ce n'est pas clair.

(9) Il faudrait être clair : la « propriété intellectuelle », cela n'existe qu'en France. Ailleurs, c'est le droit de reproduction qui importe.


Bibliographie critique


10 octobre 2005
15 septembre 2007
25 janvier 2009
12 juillet 2010.

Retour à la table du présent fichier