Revenons à
l'actualité que nous avons laissée aux chapitres
précédents, avec les affaires MP3 et P2P (cf. chap. 3, n. (19)). Ce sera pour
l'instant l'épilogue du dernier prologue.
Nous étions à ce moment en 2005.
Moins de cinq ans plus tard, l'histoire aura donné raison
à ceux qui l'avaient à ce moment, nous. Il ne s'agit
pas du tout de triompher, mais d'enregistrer les faits. Et puis,
l'histoire ne dit jamais son dernier mot et il est possible que
Jean-Noël Jeanneney, Renaud Donnedieu de Vabres, Jacques
Chirac et Lise Bissonnette, voire Daniel Ichbiah, aient fait une
bonne analyse de la réalité apocalyptique qu'ils
prévoyaiet avec le développement de
l'« empire du mal » de Google. Pour l'instant
et pour longtemps, ils auront eu tort.
Il sera question de ce que l'on appelle
en France les « bibliothèques
numériques », ce qui aura été une
affaire d'État (2004-2008). Avec un mot bien
étrange, numérique, puisqu'il s'agit
manifestement d'un charabia d'informaticien,
« numériser » et son
dérivé « numérique »
désignant l'opération qui consiste à scanner
les pages d'un livre pour en produire une image virtuelle ou une
version électronique. Je veux bien croire, puisque c'est la
réalité, que le scanneur produit, par balayage
optique, une traduction de l'image en pixels (picture elements), en
bits (binary digits) et donc en série
numérique de système binaire, mais de
là à parler sans rire de
« numériser », de
« numérisation » et de
« bibliothèque numérique », il
faut vraiment baragouiner son français.
Comme nous ne sommes pas
pressés, commençons donc par le vocabulaire, de sorte
qu'on se comprenne. En imprimerie, en cartographie et en
médecine, on nomme aujourd'hui scanneur (ou moins
correctement du mot anglais scanner) l'appareil qui sert
à prendre une photographie sous forme de version
électronique. Scanner est le verbe qui traduit cette
opération. Manifestement, numériser et
numérisation sont des hypercorrections qui tentent de
rendre les anglicismes digitaliser et digitalisation,
qui dénotent le vocabulaire spécialisé de
l'informatique, alors que le numéro, la
numérotation et leurs dérivés
concernent nécessairement et par définition le
système décimal, numériser et ses
dérivés, des opérations mathématiques,
ce qui n'a et ne peut rien avoir en commun avec les
bibliothèques ! Exit la bibliothèque
numérique, expression du plus haut comique en
français. On parlera donc de bibliothèques
virtuelles ou électroniques. Or, ce n'est pas la même
chose.
Il faut en effet distinguer deux
grandes formes d'édition sur la toile,
l'« édition virtuelle » et
l'« édition électronique », et
opposer en conséquence deux sortes de bibliothèques,
la « bibliothèque virtuelle »
composée idéalement de textes électroniques et
la « bibliothèque électronique »,
composée elle de textes virtuels. Ce croisement peut
paraître surprenant, mais il est tout à fait logique.
La bibliothèque virtuelle est sur la toile
l'équivalent d'un musée (ce qu'est fondamentalement
une bibliothèque d'encre et de papier), proposant ses livres
à la lecture, en tout ou en partie, avec la
possibilité de les imprimer. La bibliothèque
électronique est tout autre chose : il s'agit d'un
corpus de centaines, de milliers, de millions d'ouvrages
destinés non à la lecture, ni même à la
consultation à proprement parler, mais bien à la
recherche, plusieurs sortes de recherches qui dépendent des
logiciels qui permettent de les interroger. Voyons cela en
présentant les quatre réalités en cause
ici.
1. Édition virtuelle
Exemples : maldoror.org ou desade.free.fr
Définition : édition documentaire, sous forme
photographique ou textuelle, d'oeuvres transmises par
l'intermédiaire de la toile.
Il s'agit donc de la communication
électronique d'un document.
2. Édition électronique
Exemples : Maldoror (centre Phalèse de Paris 3) et
Artamene.org.
Définition : édition critique ou commentée
d'une oeuvre ou des oeuvres d'un auteur en version html, souvent
annotée, généralement accompagnée de
dossiers (bibliographies, études, annexes,
références critiques sur la toile).
Il s'agit donc de l'édition
électronique d'un document, comme son nom le dit, et non
simplement d'une forme de communication du document parmi d'autres,
la communication électronique.
3. Bibliothèque virtuelle
Exemples : Gallica.fr (Gallica 1) et Canadiana.org. Parmi de
très nombreux exemples, des milliers, donnons aussi celui de
la bibliothèque de Lisieux, bmlisieux.com.
[Parenthèse. La Bibliothèque
mondiale, de l'Unesco (wdl.org), doit aussi être retenue
comme exemple précisément parce que c'est une trop
belle illustration de la bibliothèque virtuelle. Elle a
été réalisée principalement à
partir de la Bibliothèque du Congrès des
États-Unis, qui a proposé plus de la moitié
des quelque mille livres venant de vingt-cinq bibliothèques
de par le monde. Il s'agit de la plus belle réalisation
technique au moment de son lancement (le 21 avril 2009) aussi bien
pour sa simplicité d'utilisation que pour son
efficacité de consultation. En revanche, cette
extraordinaire qualité technique est au service d'une
bibliothèque virtuelle mondiale dont le corpus est un
régal qui mériterait son étude critique :
s'il est heureux que le Des Sauvages de Samuel de Champlain
figure au nombre des 13 livres qui représentent le Canada et
par conséquent le Québec, le corpus des 31 livres qui
présentent la France n'a pas de quoi étonner !
avec les fables de La Fontaine, choisies pour enfants, dans
l'édition illustrée par Louis-Maurice Boutet de
Monvel en 1888, le magnifique Livre d'heures de Guillaume
François de Bure et près d'une dizaine de Vues de
Lourdes...]
Définition : édition systématique d'un corpus
d'ouvrages
choisis qui peuvent être consultés sur la toile, sous
forme de photographies ou sous forme de textes — ou les
deux.
Comme on le voit, l'accent est mis sur
la réalité individuelle des ouvrages que la
bibliothèque permet de consulter et d'imprimer. Il s'agit
d'une collection d'ouvrages, comme c'est le cas
déjà des bibliothèques d'encre et de papier.
Idéalement, chacun de ces ouvrages devrait être
l'occasion d'une édition électronique. C'est
le cas, remarquable et exceptionnel, de l'édition du roman
d'Émile Zola, le Rêve, sur Gallica.
La bibliothèque virtuelle permet
de prendre connaissance de fonds d'archives, d'ouvrages ou de
passages de manière efficace et rapide. On devrait pouvoir
consulter ou lire les Misères de Victor Hugo, par
exemple, sans avoir à se rendre à la BNF, la version
préliminaire inédite des Misérables ne
se trouvant pas actuellement en librairie et fort rarement en
bibliothèque (édition du manuscrit par Gustave Simon,
Paris, Baudinière, 1927, 2 vol.).
4 Bibliothèque électronique
Exemples : FRANTEXT (ATILF de Nancy) et ARTFL (Chicago), Recherche
de livres de Google.
—— Les projets concurrents ont été
abandonnés, comme Europeana (BNF, 2007-2008, aujourd'hui
fermée et remplacée par un vaste
« portail » des bibliothèques et des
musées européens) ou ne paraissent plus
viables : le projet d'Open Content Alliance est maintenant
intégré à Archive.org (the Open Library). En
revanche, on peut espérer que Gallica 2 (lancé
en mars 2008) puisse avant longtemps être compté non
seulement au nombre des bibliothèques virtuelles, mais
également des bibliothèques électroniques,
bien que ce ne soit manifestement pas sa vocation.
Définition : édition documentaire de vastes corpus
d'ouvrages dont le lexique peut être interrogé
systématiquement sous forme de chaînes de
caractères.
Il ne s'agit plus, évidemment,
au sens classique, d'une
« bibliothèque », c'est-à-dire
d'une collection de livres, mais bien d'une base de
données, dont les données sont les mots des
textes des ouvrages. C'est son corpus. Or, l'intérêt
de la bibliothèque électronique est rigoureusement
proportionnel à l'étendu de son corpus (en milliers,
en millions d'ouvrages) et au système de recherche qui
permet de l'interroger, soit à la possibilité de
recherches ponctuelles ou statistiques, dont les cas les plus
fréquents sont les recherches d'occurrences de vocables, de
citations, de sources, de cooccurrences de vocables, de locutions
ou de tournures syntaxiques, de regroupements en chaînes
étymologiques ou en familles de mots, d'index de noms
propres de divers domaines. Certes, ces corpus
électroniques peuvent être utilisés pour la
recherche bibliographique ou encore et surtout comme dictionnaires
et encyclopédies brutes (c'est-à-dire qu'on peut y
trouver ce qui permet de « constituer » une
entrée de dictionnaire de langue ou un article
d'encyclopédie); mais ils sont surtout ouverts aux
recherches, les études statistiques, lexicales,
grammaticales et stylistiques, en particulier — bien que les
voies de la recherche sur ces corpus soient déjà un
défi pour l'imagination.
Recherche de livres de Google — Beta
< books.google.fr > ou < books.google.com >.
Le projet de Google a d'abord
été connu sous le nom de Google Print. Le
volet pour les éditeurs a été
présenté à la foire du livre de Franckfort en
octobre 2004, alors que le volet pour les bibliothèques a
été lancé un mois plus tard, le 12
décembre 2004. À ce moment, une entente
était intervenue entre la compagnie Google et cinq grandes
bibliothèques universitaires pour mettre en place une
bibliothèque électronique. Il s'agissait des
bibliothèques de Harvard, de Stanford, du Michigan, de New
York, quatre grandes bibliothèques des États-Unis,
auxquelles s'ajoutait la bibliothèque britannique d'Oxford.
L'objectif était alors de scanner, pour commencer, quinze
millions de livres avant 2010, soit quatre milliards et demi de
pages. S'y ajoute l'année suivante la Bibliothèque
Nationale de Catalogne. Quatre bibliothèques se joignent au
projet en 2006 : la bibliothèque universitaire
Complutense de Madrid et celles de Californie, de Virginie et du
Wisconsin aux États-Unis. En 2007, ce sera le tour de la
bibliothèque universitaire du Texas et de celle de
Princeton, de même que la bibliothèque cantonale et
universitaire de Lausanne, première bibliothèque de
langue française à participer au projet. Puis, le 23
mai de la même année, la bibliothèque
universitaire de Gand en Belgique, largement francophone, fait son
entrée à Google. On compte à ce moment pas
moins de quinze riches et prestigieuses bibliothèques qui
vont ainsi proposer sur la toile la consultation intégrale
des ouvrages de leurs fonds qui sont aujourd'hui du domaine public,
soit pour chacune de cent milles à quelques millions de
livres. Le patrimoine mondial serait aujourd'hui de 32 millions de
livres et Google se propose de les mettre en banque en quelques
décennies. Depuis que le contrat entre Google et
l'Université de Californie a été rendu public,
en août 2006, on sait maintenant que c'était loin
d'être invraisemblable. En effet, l'université s'est
engagé à permettre à la compagnie de scanner
d'abord 600 livres par jour, durant deux mois; après cette
période de rodage, le rythme sera d'au moins 3 000
livres par jour. Oui, d'abord six cents, puis trois milles.
L'objectif est de scanner en un an les deux millions et demi de
livres de cette bibliothèque. Bref, en décembre
2008, Google avait scanné plus de sept millions de
livres.
Par ailleurs, au début de 2007,
10 000 éditeurs participaient déjà au
projet; à la fin de 2008, ils étaient 20 000.
Dans
ce cas, comme les ouvrages ne sont pas du domaine public, les
ententes sont conclues de manière particulière avec
chacun des éditeurs qui déterminent avec leurs
auteurs et ayants droit quels sont les ouvrages qui seront
scannés par Google et selon quelles modalités ils
seront consultés : ou bien Recherche de livres n'en
présentent que la page couverture et la page de titre, avec
les coordonnées; ou bien on peut en consulter un certain
nombre de pages (exprimé en pourcentage); ou bien encore on
ne peut en consulter que des extraits de trois lignes,
correspondant au droit de citation; ou enfin, l'ouvrage peut
être consulté en entier; mais dans tous les cas,
c'est l'éditeur seul qui décide de ces
modalités et il peut les modifier à sa guise. Par
ailleurs, non seulement l'éditeur peut se retirer en tout
temps du projet, mais en plus il ne signe aucune entente
d'exclusivité avec Google. En revanche, la compagnie vend
de la publicité qui est mise en corrélation avec les
titres et sujets des ouvrages recherchés.
Petit exemple : le Singulier chez Google
À l'adresse suivante, sur le
formulaire recherche avancée, vous remplissez deux
cases : « Laflèche » dans la case
auteur et « Singulier » dans la case
éditeur :
Recherche de livres de Google — Beta
< books.google.fr > ou < books.google.com >.
Professeur à l'Université
de Montréal, j'ai fondé ce que l'on peut
considérer comme de petites Presses universitaires, pour
publier mes livres à mon goût, avec une totale
liberté d'expression. Dix de mes livres ont paru à
ces Éditions du Singulier.
Il m'a fallu, le jeudi 17 novembre
2005, moins de deux heures pour inscrire mes livres dans la banque
de Google. Bien sûr, je n'ai que dix livres. Mais n'importe
quel éditeur, qui peut en avoir plusieurs milliers, ne
devrait pas mettre plus de temps à lancer
l'opération. Et en proportion, un grand éditeur y
mettra même moins de temps, car ses nombreux services
administratifs et auxiliaires feront tout le reste plus
efficacement que moi, certainement.
Voici ce que j'ai fait. D'abord je me
suis inscrit comme éditeur : on m'a donné un
numéro de passe pour entrer dans mon dossier à titre
d'éditeur (ce qui doit être confirmé par
courriel). Ensuite, j'ai rempli un formulaire où j'ai
énuméré les livres de mon fonds que je
proposais à la banque Google : moins de deux heures
plus tard, j'avais un numéro d'entrée et les
consignes pour l'envoi de mes livres, soit en format pdf, soit par
la poste. J'ai choisi la poste et j'ai expédié mes
dix livres en Californie au coût de 25 $ canadiens (les
livres ne me seront pas retournés : je suppose que les
reliures seront tranchées et les feuilles mises dans la
machine qui en prendra copie en format pdf en moins d'une heure,
s'il faut cinq minutes par livre).
C'est tout.
Il m'a fallu une heure cinquante pour
réaliser cette opération. Ce qui m'a demandé
le plus de temps a été l'emballage et
l'expédition (45 minutes au total, la poste étant
à douze minutes de chez moi), et la lecture attentive du
contrat qui lie le Singulier à Google. L'important sur ce
dernier point est que je n'ai aucun contrat d'exclusivité
avec la compagnie et que je peux me retirer du projet à ma
guise, en tout temps, sans condition.
Nous étions 10 000
éditeurs, en 2007, et nous sommes un an plus tard
20 000
à considérer que ces conditions sont pour nous
très avantageuses. Forcément. Autrement, nous ne
serions pas « partenaires » de Google. Par
ailleurs, on compte quinze grandes bibliothèques parmi nos
partenaires. Il me semble que nous sommes tous en
bonne compagnie.
Il apparaîtra vite que la
bibliothèque électronique de Google n'aura aucun
concurrent, d'abord dans les entreprises commerciales, ensuite et
surtout dans les projets gouvernementaux.
Microsoft. À l'automne
1998, MSN Search de Microsoft était lancé et
c'était alors une bibliothèque électronique
d'avenir. Le projet s'est transformé, sous la pression des
réalisations de Recherche de livres de Google, le 8 mars
2006, pour devenir Live Search. C'était alors le Live
Search Books Publisher Program. Il est mort de sa belle mort le 23
mai 2008.
Yahoo! C'est le 27 octobre 2005
qu'était lancée une contre-offensive commerciale
d'envergure, la première phase du projet Open Content
Alliance (OCA). Brewster Kahle de l'Internet Archive,
porte-parole du projet, annonce une entente avec une douzaine
d'éditeurs pour scanner en 2006 quelque 150 000
ouvrages. Plus d'un an plus tard, rien de cela n'aura encore
été fait et l'OCA restera longtemps un grand projet.
En réalité, l'OCA était une très simple
et saine réaction de Yahoo! aux projets de Microsoft et de
Google. La preuve aussi que les bibliothèques
électroniques n'étaient plus de l'ordre de
l'utopie... et que le projet de Google était
inéluctable. Car, si l'OCA est une réaction
commerciale bien « motivée », il ne
fait pas de doute que ses bonnes intentions affichées
étaient de l'ordre de la loyale concurrence. Cela dit, il
s'agit d'un projet de Yahoo! avec la participation d'entreprises
(Adobe et HP) et d'organismes publics (bibliothèques des
Universités de Californie et de Toronto) qu'on trouvera
énumérés sur son
« manifeste » :
Open Content Alliance
< www.opencontentalliance.org >.
Mais au bout du compte, cela n'aura été qu'un feu de
paille, car le projet semble stagner dès après son
lancement (2005-2008). On n'en trouve aujourd'hui qu'un prototype,
apparemment géré par Internet Archive :
OpenLibrary.org
< www.openlibrary.org >.
Internet Archive. Si Brewster
Kahle paraît avoir mis en place le prototype
rêvé par Yaho! avec les concurrents et les opposants
bon teint, bon chic, bon genre de Google, Internet Archive a aussi
sa bibliothèque virtuelle. Le site annonce
1 122 092 textes en janvier 2009, en additionnant sept
catalogues. S'il faut en dire un mot ici, c'est tout simplement
parce que ses « usagers » (faites-nous pas
rire !) siphonnent les livres de la banque Recherche de livres
de Google. En 2007, probablement (car le communiqué
d'Internet Archive n'est pas daté), le
généreux serveur anarchique comptait 524 312
livres pris à Google : « Welcome to Google
Books », déclarait-il en éditorial.
À remarquer que Google a eu le bon sens de ne pas
réagir jusqu'ici à ce travail bénévole
de nombreux amateurs :
Archive.org
< www.archive.org >.
Amazon.com
< www.Amazon.com > :
Amazon. Justement, la
concurrence aurait pu être féroce avec la mythique
librairie virtuelle, la plus importante de toutes sur la toile qui
en compte actuellement plusieurs centaines (alors que plusieurs
milliers de librairies ont pignon sur toile). Mais en fait, le
projet de Google n'est pas une menace pour la bonne vieille
entreprise de Recherche de livres. En effet, Amazon est un
système de recherche bibliographique, au service des
éditeurs, des libraires et des lecteurs, c'est-à-dire
une librairie virtuelle. Par exemple, la fonction de
recherche qu'on trouve sur le site de la librairie n'a aucune
commune mesure et même rien à voir avec le projet de
Google. C'est la fonction « Search Inside »
(-books, -Used books, - Magazines, etc.) sur Amazon.com. Il s'agit
tout bonnement d'un instrument qui sert à trouver les
ouvrages que l'on cherche. On a le même système de
recherche dans toute bibliothèque virtuelle qui se respecte.
Cela correspond aux fichiers
« matières » ou
« sujets » que l'on connaît depuis
toujours dans les bibliothèques d'encre et de papier. Si
Google peut avoir cette fonction, le projet n'a pas pour objet de
trouver des livres, mais de les traiter. Ce n'est pas une une
librairie ou une bibliothèque virtuelle, mais une
bibliothèque électronique.
On peut en conclure, je crois, que
Google a réussi à lancer un projet prometteur avec
ses nombreux partenaires, sans l'aide d'aucun État. C'est
une entreprise commerciale qui, manifestement, n'est pas
dénuée d'envergure intellectuelle, s'agissant de
mettre en place une bibliothèque universelle sous forme
électronique.
Or, le « projet »
présenté et lancé à la fin de 2004 aura
eu droit en 2005 aux foudres de la République
française, sous la forme d'un véritable délire
paranoïaque impliquant le président de la
République, son ministre des communications, le
président de la Bibliothèque Nationale et leurs
porte-voix, les journalistes de la presses (le Monde,
surtout, mais également le Figaro,
Libération, le Nouvel Observateur,
l'Express, le Soir, l'Humanité, autant
de journaux où la République a pu s'exprimer sans
aucune contrepartie), alors que les regroupements d'éditeurs
se lançaient en conséquence dans des actions
judiciaires aussi délirantes que le discours
paranoïaque hallucinant des représentants et
porte-parole de la République. On ne trouvera jamais
ailleurs qu'en France de tels débordements affectifs de
l'État, sauf au Saint-Siège du Vatican.
Car Recherche de livres de Google est
manifestement un projet commercial tout simple où aucune
raison d'État n'est en cause. La France a sa
Bibliothèque nationale qui a elle-même son Gallica,
une bibliothèque virtuelle à sa mesure. La France et
sa bibliothèque peuvent bien lancer une bibliothèque
électronique si cela leur chante, et il semble que cela leur
chante (ce sera en 2007-2008 le projet embryonnaire Europeana,
avorté, on y reviendra), mais la République ne
saurait s'en prendre à Google, c'est le bon sens le plus
élémentaire qui le dit. Autrement, où
allons-nous ?
Là est justement toute la
question, celle des cowboys qui se prennent pour les shérifs
de la toile. Car, évidemment, la République est dans
cette affaire au service des rapaces de l'édition, rien de
plus, rien de moins. La facade, toutefois, est toute
« culturelle ». La République
défend la France, la culture française ? Eh
oui, sans rire ! Alors rigolons un peu en exposant
objectivement les faits et les idées ou opinions de ces
gens-là qui parlent au nom de la République (50).
« Google n'est pas la fin de
l'histoire » : c'est bel et bien le titre de
l'intervention publique que le ministre de la culture et de la
communication de la République française, Renaud
Donnedieu de Vabres, fait paraître dans le Monde le 18
mars 2005 (51). On lira plus bas
ce morceau de bravoure, digne du père Ubu, que je
commenterai mot à mot, dont la thèse principale
voudrait que le projet de Google soit en fait un complot
impérialiste visant non seulement la France, mais l'Europe
et le Monde entier afin d'anglosaxonniser la culture de la
planète. En janvier déjà, Jean-Noël
Jeanneney, président de la Bibliothèque nationale,
avait lancé une série d'interventions qui
s'échelonneront sur toute l'année, sous le
thème hallucinant « Quand Google défie
l'Europe » (52), dont il
fera finalement un livre, sous ce titre, en avril (on en trouvera
le compte rendu critique plus bas).
L'opération est assez
incroyable, à commencer par sa rhétorique typique de
l'Élysée, qui consiste à ne jamais formuler
explicitement ce qu'on affirme pourtant clairement. On commence
donc par saluer l'entreprise de Google, on émet ensuite des
critiques générales, des inquiétudes et des
réserves bien choisies, on met évidemment en doute le
réalisme technologique de l'entreprise, sa viabilité
économique, son caractère philanthropique (sic) et,
bien entendu, sa valeur scientifique. Bref, on dénonce une
entreprise mercantile états-unienne et anglo-saxonne, on
pourfend des impérialistes. Il s'agit, il faut le rappeler,
d'un discours d'État concernant un projet de la très
modeste et très efficace entreprise Google que nous
connaissons tous. C'est manifestement là un discours
paranoïaque. Or, voilà pourtant des interventions de
hauts fonctionnaires de la République, j'insiste.
Alors s'ensuit la quête du Graal,
une saga qu'on peut résumer en quelques étapes. Le
16 mars 2005, le président de la République, Jacques
Chirac, a convoqué à l'Élysée Renaud
Donnedieu de Vabres et Jean-Noël Jeanneney pour concevoir et
édifier une Bibliothèque
« numérique » européenne afin de
contrer les méfaits de l'entreprise californienne, soit
« l'hégémonie culturelle mondiale des
États-Unis pour les générations
futures » ! selon les mots de Jeanneney. En
pratique, on a mis en place un
« contre-projet » où les oeuvres
françaises de la Bibliothèque nationale — et
exclusivement françaises —, déjà
proposées par Gallica de la BNF vont prétendre
contrebalancer le déséquilibre constitué par
le projet de Google, grâce à la contribution de 19
Très Grandes Bibliothèques européennes,
qui voudront bien faire de même, chacune pour sa langue et sa
culture (entente du 27 avril 2005, doublée d'une sorte de
« manifeste de Paris » le 3 mai). Le 30
septembre 2005, un communiqué de la Commission
européenne de l'UE lancera... un appel de propositions sur
la « numérisation et la consultation
numérique » ouvert jusqu'au 20 janvier 2006 !
En juin 2006, la Commission sera alors en mesure de faire une
« recommandation » dans le cadre du
eContentplus Programme... Voilà pour la politique
européenne.
Ensuite, évidemment, le
shérif a réussi à faire sortir de l'ombre tous
les cowboys d'Amérique et, il faut bien le dire, cela
n'était pas trop difficile. Michael Gorman,
président des bibliothèques publiques
états-uniennes, aurait manifesté sa très vive
inquiétude vis-à-vis le projet de Google,
après avoir pris connaissance des craintes du Grand
Shérif français — d'après le
shérif en question. L'Author Guild (AG) au nom des
écrivains qu'elle représente, puis l'Association of
American Publishers (AAP) (au nom de cinq groupes
d'éditeurs : McCraw-Hill, Pearson Education, Penguin
Group USA, Simon and Schuster et John Wiley and sons) ont donc
intenté deux poursuites en septembre et octobre 2005 contre
Google pour exiger... Devinez quoi ? Eh oui : des
redevances, évidemment.
Eh bien ! grâce à Google —
au grand dam des cowboys européens qui se prenaient pour des
shérifs —, ces capitalistes états-uniens vont
accepter le 28 octobre 2008 un règlement tout simple qui
devrait brasser environ 125 millions de dollars lors de sa mise en
place. L'AG et l'AAP acceptent de retirer leur poursuite ridicule
(comme la plupart des poursuites commerciales en justice,
évidemment), contre une entente qui permettra au programme
Recherche de livres d'afficher à l'écran
jusqu'à 20% des pages d'un livre sous droits; ensuite, les
utilisateurs pourront
acheter le fichier scanné par Google, les profits
étant partagés entre la compagnie et les auteurs et
leurs éditeurs. À remarquer que c'est ce que se
proposait Google depuis le début : relancer les livres
épuisés, proposer aux auteurs et aux éditeurs
de rejoindre à nouveau le public. Ces procès et
procédures juridiques étaient prévus bien
avant les toutes premières opérations
matérielles à la bibliothèque de
l'Université du Michigan, comme le prouvent les contrats
passés avec les bibliothèques partenaires (Google
s'engageait à défrayer tous les recours juridiques
pouvant affecter ces universités). Dès que l'entente
d'octobre 2008 sera entérinée par les tribunaux,
Google mettra en place le registre où les auteurs et les
éditeurs s'inscriront à ce programme.
Mais revenons à l'Europe de nos
cowboys.
Au bout du compte, Europeana est mis en orbite
le 22 mars 2007. C'est le prototype de la
« Bibliothèque numérique
européenne » réalisé par la BNF. Il
s'agit du produit matériel promu, justifié et
« théorisé » par le discours
étatique de l'Élysée, celui de Renaud
Donnedieu de Vabres et de Jean-Noël Jeanneney. Une copie
conforme, en miniature, de Recherche de livres de Google.
C'était vraiment risible, même si c'était en
fait bien prévisible. Autrement dit, on fait ce que l'on
peut, les informaticiens de France n'étant pas plus nonos
que ceux des États-Unis, tandis que voilà des
fonctionnaires et hommes d'État qui se permettaient de
péter pas mal plus haut que le trou. Europeana, un modeste
produit étatique, devait relever le
« défi » de Google. Qu'on en juge.
Il suffisait de se reporter au site
d'Europeana pour se demander si l'on ne se trouvait pas sur celui
de Google ! En miniature.
La bibliothèque électronique
comprennait 12 000 ouvrages de trois bibliothèques, les
bibliothèques nationales de France, de Hongrie et du
Portugal. Un bel effort, même s'il était
dérisoire, s'agissant d'une entreprise étatique.
Cela dit, tout comme Recherche de livres de Google, dont le corpus
se comptait alors en centaine de milliers d'ouvrages, en millions
avant longtemps, il ne s'agissait encore que d'un prototype. Or,
ce qui frappait, c'était la ressemblance des deux
bibliothèques électroniques, alors qu'Europeana
venait après et en réaction à Google...
À ce moment, la questions n'était pas de savoir s'il
fallait dédoubler les efforts,
puisque la montagne de l'Élysée n'accouchait que
d'une souris.
On se demandait plutôt quand Recherche de livres de Google
serait
rattrapée par quelques concurrents quelque peu
sérieux. Il était certes à l'honneur de
Google d'avoir mis en place la
première bibliothèque électronique
dépassant le million (puis les quelques millions)
d'ouvrages, mais combien de temps sera-t-elle
restée la plus importante ? voilà la
question.
Sur Europeana (2007-2008), vous n'aviez pas la
fonction recherche avancée qui permet de choisir le
nombre d'ouvrages affichés par écran; en revanche,
pour les résultats, vous en connaissiez la provenance (selon
les trois bibliothèques), les dates par siècles, la
langue et les auteurs, quatre facteurs calculés
automatiquement (mais vous ne pouviez pas limiter votre recherche
selon ces critères). Autrement, il n'y avait aucune
différence sensible entre Recherche de livres de Google et
Europeana, du point de vue du logiciel permettant d'interroger leur
corpus. Sauf évidemment, il faut le répéter,
qu'Europeana ne comptait que 12 000 ouvrages. Google, au
moment de son lancement se proposait d'en scanner plus de
150 000 dans l'année en cours et son objectif
était de franchir rapidement le cap du million de livres, ce
qui a été très vite fait. Europeana et
Google, ce n'était évidemment pas comparable, alors
que précisément c'est le nombre qui fait la force
d'une bibliothèque électronique.
Voici maintenant le petit exposé que je
présentais en 2005. S'il était par trop optimiste,
on le verra à l'analyse qui suit, en 2007, il illustre bien
la nature et la portée des bibliothèques
électroniques. Je marque de la parenthèse [?!] les
données évidemment invraisemblables. Je n'avais
manifestement pas lu mes « données ».
Novembre 2005
Le site expérimental
Recherche de livres de Google —
Beta.
est encore bien loin d'être la bibliothèque
électronique qu'elle sera forcément avant longtemps.
Mais j'imagine qu'elle peut déjà servir les
chercheurs, même s'il n'est pas encore possible de programmer
la recherche en fonction de la langue des ouvrages et qu'on ne peut
pas non plus ordonner les résultats par ordre chronologique
des ouvrages trouvés ou encore par ordre de
fréquences des vocables et locutions recherchés,
ordre croissant ou décroissant. En revanche, on peut
déjà circonscrire sa recherche à une
période donnée (par exemple, 1800-1899, pour limiter
la recherche au XIXe siècle).
Voici quelques exemples. Recherches
effectuées les 11, 12 et 14 novembre 2005.
La recherche sçavant OR sçavants
OR sçavante OR sçavantes donne le résultat
suivant : le mot se trouve au moins une fois sur 1 810
pages
dans 114 livres. J'indique dorénavant, par raccourci, x
pages de y livres. Le système ne distingue pas les
minuscules et les majuscules. La recherche savant OR savants OR
savante OR savantes conduit à 205 000 pages de 288
livres.
Dans ce corpus, on devrait donc trouver le vocable savant
dans environ 400 livres, mais curieusement, ils ne sont pas en
majorité en français, comme on le verra (le vocable
se trouvant souvent dans des citations).
Son correspondant en anglais, learned,
n'est pas univoque; la « forme » (car ce n'est
pas un vocable comme savant) se trouve dans
2 590 000 pages
de 189 livres [?! ouf !]. La recherche nous apprend que
le système compte actuellement les pages au millier
près, au-delà de mille occurrences.
Le vocable homme OR hommes = 1 300 000 pages de 49 livres
[?! ouf !] ;
Le vocable femme OR femmes = 571 000 pages de 161
livres [?!].
— À lui seul, ce résultat est extrêmement
significatif de la distribution des deux vocables de la
langue française (même si plusieurs de ces livres ne
sont pas en français) : il ne correspond pas à
leurs fréquences relatives, mais du moins à leurs
distributions dans le Français fondamental (Paris,
Didier, 1964).
Le vocable man OR men = 42 100 000 pages de 205 livres [?! pour
42 100 ?];
Le vocable woman OR women = 12 600 000 de 231 livres.
Le vocable hombre OR hombres = 277 000 de 149 livres;
Le vocable mujer OR mujeres = 115 000 de 196 livres.
Le vocable uomo OR uomini = 199 000 de 235 livres.
— Malheureusement le féminin donna OR donne n'est pas
univoque, correspondant à des mots français et
anglais, dont deux formes de notre verbe donner.
Prenons alors le mot suivant univoque dans l'ordre
alphabétique :
Le vocable doppio se trouve sur 14 200 pages de 239 livres.
On peut conclure sur quelques
expériences portant sur les vocables de hautes
fréquences. Le système ne donne pas de
réponse pour la recherche « le OR la OR
les » ni « the »... heureusement
peut-être !
En revanche, on trouve les deux résultats suivants :
Le pronom adjectif leur OR leurs = 1 380 000 dans 97 livres
La commande un OR une OR des = 14 300 000 pages dans 83 livres [?!
pour 14 300 ?].
Cette dernière recherche ne correspond pas exactement
à la fréquence de l'article indéfini (des est
moins souvent le pluriel de l'article un que la contraction de +
les). Mais peu importe. Comme il est impossible qu'un livre en
français ne comprenne aucune occurence de l'article
indéfini, sauf s'il est écrit par un Oulipien qui
s'est donné cette consigne !, alors le corpus des
livres de langue française de la banque devrait être
d'environ 80 livres actuellement (novembre 2005).
À suivre... On peut déjà
rêver de ce que laisse entrevoir cette toute simple recherche
sur un site encore à l'état expérimental.
Septembre 2007
Malheureusement, le système de
recherche de Google ne répond pas encore à ces
espérances. Depuis quelques mois maintenant, les
données statistiques ci-dessus sont manifestement
infirmées. Non seulement je ne peux plus les confirmer,
mais elles paraissent tout à fait inexactes.
Bref, c'était trop beau pour être
vrai.
Je reprends donc l'exercice, en le
simplifiant, sur quelques exemples privilégiés.
Homme/femme
• L'Élaboration du français
fondamental (Paris, Didier, 1964) :
— homme : fréquence = 131; répartition = 55;
rang = 253;
— femme : fréquence = 275; répartition = 74;
rang = 149.
Voici le résultat de la recherche sur
quelques bibliothèques électroniques, à partir
des plus modestes et des plus sûres jusqu'aux plus vastes...
et moins
sûres.
• Champion électronique : Corpus de
la littérature narrative du Moyen Âge au XXe
siècle : romans, contes, nouvelles, vol. 1 de la
Base Internationale de Littérature Électronique, par
Champion électronique et CNED. Corpus d'un millier de
classiques de la littérature française. Le corpus
peut être interrogé par deux logiciels, ARTFL Projet
de
Chicago ou Champion électronique.
Selon les deux logiciels, les résultats ne sont pas
exactement les mêmes. Voici d'abord le résultat
d'ensemble sur le serveur de Champion électronique :
homme/hommes = 64 186 occurrences dans au moins 728 documents;
femme/femmes = 47 951 occurrences dans au moins 674 documents.
Malheureusement, le logiciel d'ARTFL de Chicago, sur le même
corpus, ne répond pas aux demandes qui dépassent
10 000 occurrences. Il faut donc prodécer par tranches
(par
siècles pour les 16-17, 18 et 20e; puis par tranches pour le
XIXe siècle, 1800-1825, 1826-1835, etc.). Je calcule
ensuite le total suivant :
homme(s) = 64 842 occurrences;
femme(s) = 49 051 occurrences.
Je trouve par la même occasion que la distribution du vocable
varie selon les siècles et les genres : pour la
période 1876-1890, on obtient les résultats suivants
(avec le logiciel de l'ARTFL de Chicago, je le rappelle) :
— homme/hommes = 6 051 occurrences de 297 documents;
— femme/femmes = 6 740 occurrences de 297 documents;
dans les romans de Zola :
— homme/hommes = 2 745 occurrences dans 10 documents;
— femme/femmes = 3 208 occurrences dans 10 documents.
dans les romans de Proust :
— homme/hommes = 1 520 occurrences dans 7 documents;
— femme/femmes = 2 030 occurrences dans 7 documents.
•
ARTLF Projet de l'Université de Chicago constitue
actuellement un corpus de 2 600 ouvrages. En proportion, les
résultats correspondent au corpus de Champion
électronique :
— homme/hommes = 327 625 occurrences;
— femme/femmes = 151 952 occurrences.
dans les romans de Zola :
— homme/hommes = 5 140 occurrences;
— femme/femmes = 5 380 occurrences.
dans les romans de Proust :
— homme/hommes = 1 523 occurrences;
— femme/femmes = 2 380 occurrences.
•
Recherche de livres de Google (16 août 2007) :
— homme OR hommes = 56 000 occurrences dans 374 ouvrages;
— femme OR femmes = 53 300 occurrences dans 570 ouvrages.
Mais malheureusement, ces données ne
sont pas produites par le logiciel, mais doivent être
déduites en fonction des résultats selon les
écrans. Avec ces déductions, on
obtient les résultats suivants :
— man OR men = 4 300 600 dans 459 ouvrages;
— woman OR women = 2 540 600 dans 469 ouvrages;
— hombre OR hombres = 29 300 dans 577 ouvrages;
— mujer OR mujeres = 22 800 dans 529 ouvrages.
Ces statistiques ne concordent pas avec les
données obtenues en novembre 2005. Cela dit, si je lance un
mot de basse fréquence, Jogues, je trouve 1 158
occurrences dans 343 livres, dont le second volume de ma
série des Saints Martyrs canadiens consacré au
missionnaire en deuxième position, après Novum
Belgium de Jogues, paru chez Cramoisy-New York en 1862. Suit
la biographie du missionnaire par Félix Martin en 1873 et
ensuite par celle de Francis Talbot en 1935. Ce résultat
est vraiment remarquable, du point de vue bibliographique,
même si j'aurais bien aimé figurer en première
place ! d'autant que j'ai rédigé cinq ouvrages
sur les Saints Martyrs canadiens.
• Europeana, Bibliothèque
numérique européenne.
Catastrophe ! Jogues est confondu avec
Jogú et on se retrouve avec 19 ouvrages, 15 ouvrages
français, dont le premier est de Rémy de Gourmont,
1861, qui vole la vedette avec les Français au Canada et
en Acadie, suivi de Chateaubriand, quatre fois ses oeuvres
complètes, avec 2 ou 3 occurrences de notre bon Isaac Jogues
ici ou là...
— homme = 6 924 ouvrages;
— femme = 6 552 ouvrages.
La recherche homme donne les mêmes résultats que
hommes (pluriel), mais il faut dire que la recherche de mot y est
très approximative. Vous lancez homais et vous vous
retrouvez avec Home, homme, l'homme, etc. En plus, on compte les
vocables des titres courants ! Bref, le logiciel d'Europeana
n'est manifestement pas au point. En plus, le critère de
classement des ouvrages ou leur pertinence
(représentée par un petit graphique et un
pourcentage) ne sont pas très clairs pour moi. Bien
entendu, on comprend que ce n'est là qu'un prototype et
c'est le mieux qu'on puisse dire.
Il me semble que toute la question est
là. La BNF pourrait partager son corpus avec Recherche de
livres de Google (sans exclusive, évidemment, comme c'est le
cas des partenaires de la compagnie). Elle établirait
évidemment ce corpus, puisqu'il s'agit de ses ouvrages. En
revanche, elle pourrait mettre au point son propre système
de recherche pour les ouvrages de son fonds. Bien sûr, elle
partirait de loin, comme on vient de le voir. Toutefois, sa
bibliothèque électronique se compterait très
vite en centaine de milliers d'ouvrages. Pourquoi donc se
priverait-elle de Google ?
En effet ! La question ne se pose plus
aujourd'hui. La Bibliothèque nationale de France, comme
celle du Québec, s'est privée jusqu'ici du formidable
projet de Google. On peut toujours rêver d'un retour vers le
futur, mais ce sera forcément longtemps de l'ordre de la
rêverie.
Cela dit, la question d'une
bibliothèque électronique européenne ou
française ne se pose plus non plus. Europeana a
déclaré forfait en janvier 2008. La
République a passé la main en douce, d'une part en
laissant le nom fabuleux d'« europeana »
à la Bibliothèque européenne (European
Library), mise en place depuis les années 2000, sur la toile
depuis le 17 mars 2005, et relancée sous le nom d'europeana
le 20 novembre 2008 (en réalité, elle a
été fermée le lendemain et réouverte le
27 décembre). Il s'agit d'un portail des
bibliothèques et des musées d'Europe, avec quelques
fonds d'archives d'État, redirigeant les utilisateurs vers
les institutions d'origine. Indexant deux millions de fichiers
actuellement, six en 2011, Europeana (situé à La Haye
aux Pays-Bas) regroupe des institutions de 27 pays, comptant 22
langues. Cela dit, il s'agit évidemment d'une collection
virtuelle et non d'une bibliothèque
électronique. Qu'on en juge :
Europeana, Bibliothèque
européenne
< www.europeana.eu >
Comme on le voit, Europeana et Recherche de livres ne se comparent
pas, à commencer par le fait tout simple que le programme de
Google interroge plus de sept millions de livres, ce qui donne
prise sur toutes les langues de tous les pays
du monde occidental (pour l'instant).
Ensuite, en revanche, en conséquence,
la Bibliothèque nationale de France s'est remise à
s'occuper de ses affaires au lieu de se mêler de celles des
autres. C'est Gallica 2, la seconde phase de la
bibliothèque virtuelle. L'opération consiste
à scanner 100 000 livres par an durant trois ans, de
2008 à 2011. Le projet n'a plus rien à voir avec un
Google miniature, mais au contraire avec une
démultiplication de la bibliothèque Gallica qu'on a
connue et appréciée jusqu'ici.
En plus, il apparaît qu'avec cette
seconde phase de son développement, Gallica pourra
rapidement devenir une bibliothèque électronique. Je
pense qu'elle devrait être un complément important de
la machine Google, aussi précis que les données du
TLF, qui lui ont d'ailleurs servi d'embryon. Si vous lancez
maintenant (19 janvier 2007) la recherche « Maldoror ET
Holzer », en restraignant la recherche aux ouvrages de
langue française, vous trouvez quatre livres sur
Gallica 2 et 101, sur la Recherche de livres de Google. La
disproportion est évidente et ne peut être
renversée. Et par malheur, dans les Chants de
Maldoror, vous ne trouvez qu'une seule des deux occurrences du
nom Holzer sur Gallica. Pourtant, il ne fait pas de doute que
Gallica devrait avant longtemps servir, par sa précision,
à corroborer et à valider sur son précieux
petit corpus soigné les données brutes obtenues
grâce au système de Google.
Pour commencer, je reproduis et commente, à l'appui de
mon analyse, le « point de vue » du ministre de
la culture et de la communication de la République de
France, paru dans le Monde le 18 mars 2005 (51), ainsi que le communiqué de
presse du Syndicat national de l'édition (SNE) de la
République (2006). Entre ces deux documents, je propose une
analyse critique du livre de Jean-Noël Jeanneney,
président de la Bibliothèque Nationale de
France (52).
Renaud Donnedieu de Vabres
Ministre de la culture et de la communication
République française
Il y a quelques semaines éclatait,
comme un coup de tonnerre dans le ciel numérique (a), l'annonce qu'un serveur américain
puissant, efficace, populaire, allait numériser et proposer
en ligne 15 millions de livres provenant du patrimoine
conservé par quelques-unes des plus prestigieuses
bibliothèques anglo-saxonnes.
L'événement intervient dans un
climat intellectuel et culturel où la numérisation
des documents et des oeuvres apparaît comme la clef de tous
les problèmes. Celui de l'accès aux oeuvres, que la
numérisation rendrait aisé, agréable, libre
et, de préférence, gratuit (b).
Celui de la fréquentation des bibliothèques, qui
trouveraient de nouveaux publics et de nouvelles missions à
travers la diffusion numérique. Bref, tel Francis Fukuyama
prophétisant bien imprudemment, après Alexandre
Kojève, « la fin de l'histoire », les
nouveaux oracles de la numérisation (c) auraient trouvé, grâce à
Google, l'aboutissement utopique de tant d'années d'efforts,
de recherche et... de politique culturelle (d).
La présence des oeuvres sur les
réseaux numériques est un enjeu fondamental et une
priorité du ministère de la culture et de la
communication. Chacun de ses grands domaines d'intervention —
le patrimoine, l'architecture, les archives, les musées, les
arts plastiques, la musique, le livre, l'audiovisuel — y
consacre des moyens importants, avec la volonté de proposer
des collections numériques sélectionnées,
cohérentes, signifiantes, repérables, en conciliant
exigences scientifiques (e) et souci de
présentation au plus large public.
La base Joconde, qui recense 178 000 oeuvres
des collections de nos musées, accessible à tous sur
Internet, en est une bonne illustration. Le plan de
numérisation de la presse du XIXe siècle,
engagé par la BNF, en est une autre. Je tiens à
mentionner aussi la base « enluminures », avec
ses 80 000 images tirées des manuscrits
médiévaux, conçue avec le CNRS et toutes les
villes où ces trésors sont déposés.
Ces collections sont le fruit non d'une
numérisation de masse (f), mais,
chaque fois, d'une politique documentaire pensée,
réfléchie en fonction de l'existant et des besoins
croisés de la recherche, de la quête de culture de
chacun, et de la conservation.
Il ne faut pas sous-estimer les
difficultés techniques, financières et
intellectuelles d'un tel chantier (g) :
numériser des livres et des périodiques anciens sans
les détériorer est une tâche longue,
chère et difficile (h). Ce travail ne
sert à rien s'il ne s'accompagne parallèlement d'un
travail de signalement, de description et d'indexation des
documents, qui permettra de les reconnaître et de les
repérer dans les outils bibliographiques qui devront
accompagner les textes (i).
Au-delà de la numérisation,
Internet, avec les moteurs de recherche, inaugure une nouvelle
forme d'accès au savoir. Nous avons probablement à
apprendre de Google, dont le succès vient largement de sa
simplicité et de sa facilité d'accès (j). Si la plupart des collections
numérisées du ministère sont accessibles sur
le Web — comme le service Gallica de la BNF (k) —, nous devons en améliorer la
cohérence. C'est la vocation du portail culture.fr,
dédié aux événements et aux sites
culturels. Demain (l), il sera le portail
d'accès à nos collections
numérisées.
Tels sont mes choix. Telle est la politique
que j'encourage, au ministère et dans les
établissements qui en dépendent, grâce aux
crédits de mon budget consacrés à la
numérisation : plus de 15 millions d'euros par an, en
plus du personnel qui s'y consacre (m).
L'accès direct et automatique au
savoir (n) permis par les moteurs de
recherche ne saurait ni être exclusif ni remettre en cause le
rôle essentiel, dans la culture et l'éducation, des
médiateurs et des passeurs. Je ne crois pas que la seule
clef d'accès à notre culture soit le classement
automatique par la popularité, qui a fait le succès
de Google (o).
Au moment où l'on célèbre
à si juste titre la mémoire de Foucault, de Sartre et
de tant d'autres penseurs de notre modernité (p), j'ai presque de la gêne à rappeler
que le savoir déposé dans les bibliothèques ne
se livre pas de lui-même. Dans son épaisseur, sa
densité, sa complexité, il fait écran à
lui-même. Il faut fouiller, exhumer, reconstituer,
hiérarchiser (q).
C'est le travail du chercheur. Cette
« archéologie du savoir », cette
production d'oeuvres sur les oeuvres sont l'indispensable
médiation sans laquelle les formations intellectuelles et
culturelles du passé nous resteraient inaccessibles. C'est
aussi le sens de l'action du ministère qui crée, y
compris sur Internet, des « parcours » dans les
collections, des expositions virtuelles, afin de guider
l'utilisateur dans toute la richesse et la diversité de
notre patrimoine (r).
Enfin, le numérique ne saurait
prétendre déployer le savoir au mépris des
conditions de production de ce savoir. Tel est le sens du projet de
loi sur le droit d'auteur dans la société de
l'information que le gouvernement présentera bientôt
au Parlement. Tel est celui de mon combat pour l'accès aux
oeuvres légalement sur l'Internet (s).
Oui, j'affirme, à côté de
la modernité du numérique, la non moins vivante
modernité du lien (t), qu'il soit de
nature sociale, économique, intellectuelle ou culturelle.
C'est par elle que nous ne sommes pas seulement des consommateurs
d'une information « organisée » par
d'autres (u), mais que nous participons
à la culture, comme des volontés coresponsables de la
production, de la compréhension, de la vie et de la
transmission d'une oeuvre (v).
Renaud Donnedieu de Vabres est ministre de la
culture et de la communication. Article paru dans le Monde
le 18 mars 2005
(a) Voyons donc ! On peut oublier, d'accord, le
Paradis des drôles de numéros, le ciel des
étoiles numériques, mais certainement pas le coup
de tonnerre diabolique. Le projet de Google était connu
depuis plusieurs années et se trouvait déjà
à l'épreuve sur Google, qui pouvait renvoyer à
de très nombreuses « quatrièmes de
couverture » et à de nombreux sommaires. Le
ministre vient tout simplement d'apprendre qu'il y a trois mois que
cinq grandes bibliothèques s'associent à Google.
Pour nous tous, ce n'est qu'une heureuse étape d'un projet
en cours que le ministre paraît découvrir.
Incidemment, il faut insister, cet exposé, qui
découle de la pensée du président de la BNF,
est méprisant pour les responsables des cinq
bibliothèques qui se sont associées à Google,
responsables qui ne sont certainement pas des
incompétents.
(b) Non, monsieur le ministre, une
bibliothèque électronique n'est rien de cela. Vos
fonctionnaires, ou plutôt les fonctionnaires de la
Bibliothèque Nationale de France, vous ont certes ainsi
présenté les choses, par la voix du président
Jean-Noël Jeanneney. C'est tout à fait inexact. Il ne
s'agit nullement d'« accéder » aux
oeuvres de « manière libre, etc. ».
Votre énumération montre que vous n'avez aucune
idée de la nature d'une bibliothèque
électronique, dont le premier et principal objectif est de
permettre la consultation et la manipulation de très vastes
corpus (recherche de mots, de citations, de sources et de passages,
cooccurrences de vocables, locutions et tournures syntaxiques,
chaînes étymologiques et familles de mots, index de
noms propres, etc.).
(c) Francis Fukuyama, Alexandre Kojève :
vos lectures, monsieur le ministre, comme on le voit au titre de
votre article qui en découle, vous font honneur, mais je
vois bien mal ce que ces penseurs viennent faire aussi abruptement
dans votre exposé, puisque personne n'a rien
prophétisé. Pas d'oracles dans le paysage. Je me
permets de vous rappeler que ce ne sont pas vos apocalypsologues
Fukuyama et Kojève, mais Larry Page et Sergei Brin qui ont
fondé la compagnie Google et que c'est Adam Smith qui
gère le projet de Google. Mais non ! monsieur le
ministre, un autre Adam Smith, mais je dois dire que vous
être maintenant plus proche de la réalité.
Oui, pas un prophète, mais un capitaliste, qui sait fort
bien que Google n'est pas « la fin de
l'histoire », ce qui est une affirmation vraiment
ridicule en l'occurrence, puisque c'est le début de sa
fortune !
(d) Si l'on vous comprend bien, vous affirmez que
le projet de Google ne saurait être l'aboutissement de votre
« politique culturelle ». Évidemment,
car je ne pense pas que le projet Google ait pu compter sur la
collaboration de la Bibliothèque Nationale de France.
Est-ce que vous voudriez sérieusement dire ce que vous
affirmez, à savoir que vos projets sont tellement grandioses
qu'ils sont franchement utopiques et que ce n'est tout de
même pas la réalisation du projet de Google qui y
mettrait fin, puisqu'ils sont... irréalisables ? C'est
pourtant ce que vous dites et... ce qui risque fort de se
produire.
(e) Pourquoi énumérer ces attributs
? Les collections nationales sont
« sélectionnées, cohérentes,
signifiantes, repérables, en conciliant exigences
scientifiques » ? Bravo. Non seulement on ne
demande rien de cela à une bibliothèque
électronique, mais on ne veut pas de sélection du
tout : on veut tout, tout ce qu'il est possible d'y mettre le
plus vite possible, de telle sorte que ces attributs ne sauraient
s'appliquer. Le ministre reprend le raisonnement de ses
fonctionnaires bibliothécaires qui, eux, doivent choisir,
étant donné les coûts et les espaces qui sont
forcément comptés. Une bibliothèque
électronique n'a que faire de sélections, de
cohérence, de signifiance, de références et de
ce qu'on appelle des « exigences
scientifiques ». Cela dit, si ces attributs ne
définissent en rien une bibliothèque
électronique, il est présomptueux de laisser entendre
qu'ils ne s'appliquent pas aux résultats du projet de
Google... Ce serait même de la diffamation, étant
donné les résultats actuellement accessibles.
(f) Quelle injure ! Or elle est injuste. Vous
nous dites que vos collections Joconde et Enluminures
présentent 250 000 oeuvres soigneusement choisies.
Mais
à partir du moment où vous pouvez, dans une
première période de quelques années seulement,
en offrir dix fois plus, deux millions et demi, la question du
choix ne se pose plus du tout de la même
manière : on choisit alors toutes, oui, toutes les
oeuvres qui peuvent être traitées vite et en grand
nombre. Je comprends, bien sûr, que votre objectif est de
dénigrer le projet de Google en faisant l'apologie de vos
collections, car autrement on verrait mal comment vous pourriez
vous réjouir que Joconde et Enluminures ne soient pas le
« fruit d'une numérisation de
masse » ! Une numération (sic)
d'élite, peut-être ? Ou choisie par
l'élite, vous et vos savants ? Élitiste, alors.
Mais passons outre, car on a compris.
(g) De quoi je me mêle ? Il me semble,
monsieur le ministre, que vous avez assez de pain sur la planche
avec Gallica sans vous mêler du chantier de Google.
(h) Faux. Il n'est pas « long, cher et
difficile » de scanner les documents
« anciens ». Il n'est pas du tout difficile,
il est seulement plus long de traiter les documents fragiles
(fragiles, et non anciens). Et franchement, nous n'en sommes pas
encore à la question des ouvrages des Grandes
Réserves. Est-ce que monsieur Jeanneney n'aurait pas pu
expliquer cela au ministre ?
(i) Travail enfantin. Google le réussit
actuellement parfaitement bien.
(j) Changement de sujet : le système de
recherche Google n'a absolument rien à faire ici, puisque
depuis de début c'est le projet Recherche de livres de
Google qui est dénigré sans vergogne.
(k) C'est la première fois que le ministre
nomme Gallica. Pourtant, nous ne sommes pas dupes : c'est
Gallica contre Google ! Il s'agit d'une piètre
tentative de noyer le poisson, y mêlant de la Joconde et de
l'Enluminure...
(l) Bravo !
(m) On sait lire. Jusqu'ici, on a lu une critique
virtuelle du projet de Google, sous la forme d'une vague et
abstraite apologie des « réalisations »
de la République française. Pas la moindre
proposition de « choix » du ministre, ni de
« politique » du Ministère de la culture
et des communications. Mais en ce qui concerne le budget, si 15
millions d'euros faisaient 30 millions de dollars, alors en cinq
ans ce serait le budget du projet de Google. Questions : ce
budget n'est-il pas trop modeste, s'agissant de celui d'un
État ? Et si les États européens se
regroupent pour en mettre dix ou quinze fois plus, qui du
consortium étatique européen ou de la petite
compagnie californienne sera le plus efficace ? En tout cas,
monsieur le ministre et son président de la
Bibliothèque nationale dépensent déjà
beaucoup de temps et d'énergie à dénigrer un
projet qui ne les concernent nullement...
(n) Confondre la consultation électronique
avec le « savoir » est tout de même
surprenant.
(o) Quelles confusions. Mêler la
consultation électronique, le système de recherche
Google et le projet Recherche de livres de Google, c'est vraiment
à croire que les apocalypsologues Fukuyama et Kojève
n'avaient pas tort de voir dans Google la fin de l'histoire.
Google ne donne pas accès automatique et direct au
savoir ? Alors changez de système de recherche. Moi,
je vous le dis franchement, je n'utilise pas Google, mais
Altavista, car lui donne un accès automatique et direct au
savoir.
(p) Après Fukuyama et Kojève,
Foucault et Sartre. Il faut s'attendre au pire.
(q) Je m'en doutais ! Monsieur Renaud Donnedieu
de Vabres est très gêné d'avoir à
écrire que consulter ne suffit pas, qu'il faut aussi lire.
Ah ! misère... N'y aurait-il personne à la
Bibliothèque Nationale de France pour expliquer au ministre
quelle différence nous faisons tous entre la
bibliothèque électronique ou virtuelle et leur
bibliothèque d'encre et de papier ? Mais en lisant la
suite, vous comprendrez vite que l'auteur du point de vue ne traite
plus du tout de son sujet. On est maintenant dans le discours
clérical pur, le sermon culturel qui sert à montrer
que ce qui a été dit doit être juste, puisque
cela a été exposé par un homme qui
écrit si bien. C'est l'éloquence
ministérielle.
(r) C'est précisément
l'élitisme qu'il faut dénoncer. Monsieur le ministre
et ses fonctionnaires se proposent de guider les citoyens.
(s) Après le cowboy, voici le
shérif. Avec promesse d'utiliser l'arme de destruction
massive : une nouvelle Loi du droit d'auteur.
« Son combat »,
« légalement », etc. « Le
numérique ne saurait prétendre déployer le
savoir au mépris des conditions de production de ce
savoir ». Au cas où ce ne serait pas clair pour
tous, traduisons : « il faut payer »,
« il faudra payer ». Et, sous-entendu, le
cowboy est assez combatif : « attention : non
seulement Google risque de faire des profits avec la
publicité dans sa bibliothèque électronique,
mais est-ce que la compagnie va payer des droits d'auteurs aux
éditeurs et aux administrateurs de sociétés de
gestion ? ».
(t) Il doit y avoir ici une faute syntaxique ou
typographique, car je ne pense pas que la phrase soit
française. Qu'est-ce donc qu'un
« lien », employé ainsi
absolument ? Tout le reste me paraît d'ailleurs
illisible, même si on comprend très bien le sens de
l'éloquence ministérielle.
(u) Les autres, ce sont Adam Smith et les
employés du projet de Google. Avec cette dernière
pointe, on voit que le ministre n'a pas oublié son sujet.
Or, justement, lui veut nous « organiser », on
l'a vu (f), pas les responsables de
Google.
(v) Après la dernière pointe, c'est
vraiment une belle finale. Nous « participons à
la culture, comme des volontés coresponsables de la
production, de la compréhension, de la vie et de la
transmission d'une oeuvre ». Bravo, applaudissements.
Voyons donc. Qu'est-ce que cela peut signifier dans le combat
contre le projet de Google ? — Qu'on trouve là
de dangereux irresponsables sans culture qui méprisent les
oeuvres ? Si la phrase pouvait avoir un autre sens, j'en
serais fort aise. Mais cela ne me paraît pas possible.
L'auteur exprime clairement pour finir le fond de sa pensée,
« moteur de recherche » de sa thèse et
de son exposé.
Jean-Noël Jeanneney, Quand Google défie l'Europe
: plaidoyer pour un sursaut, Paris, Fayard sous le nom de
« Mille et une nuits », 2005, 114 p. Le
texte est daté des 6 au 29 mars 2005 (p. 110).
Ce texte restera forcément dans les
archives de l'histoire et c'est bien dommage pour le sympathique
Jean-Noël Jeanneney. On ne trouve pas souvent, en effet, des
ouvrages qui expriment aussi simplement et crûment les
opinions de leurs auteurs, aussi franchement insupportables
peuvent-elles être. Il est très rare, en particulier,
que le racisme s'affiche, même sous forme
édulcorée de chauvinisme ou de patriotisme. Par
ailleurs, les arguments de l'auteur pourraient être pris en
considération, évidemment, s'il ne s'agissait non
seulement d'arguments d'autorité, mais pour bien dire
d'arguments d'État. Il n'y a absolument aucune raison,
c'est le cas de le dire, de prendre en considération des
« arguments » qui sont en fait, en
réalité des décisions d'entreprises.
Qu'à l'inverse, la BNF décide de produire une
bibliothèque électronique, voire un système de
recherche pour rivaliser avec Google, voilà qui serait
formidable. Mais, écrivons-le entre guillemets :
« bonne chance, mon vieux ! », car la
France n'est certainement pas aussi efficace que les entreprises
privées en la matière.
Disons d'abord que ce texte du
président de la Bibliothèque Nationale de France
n'est pas en accès libre sur la toile. Vous devez l'acheter
aux éditions Fayard. Il est donc « sous
droit ». Car j'aurais beaucoup aimé en reproduire
ici de très larges extraits pour les commenter mot à
mot. Pourquoi pas ? Ne s'agit-il pas d'un document
d'État ?
Ensuite, et c'est d'ailleurs le seul et unique
bon point que j'accorde à Jean-Noël Jeanneney,
très important, toutefois : voilà un haut
fonctionnaire de l'État qui est un intellectuel
n'hésitant pas à s'exprimer publiquement dans le
cadre de ses fonctions. Cela est tellement rare et précieux
que jamais d'aucune manière je ne m'en prendrais à
son livre si je n'y étais forcé à cause de son
sujet. D'ailleurs, je dois dire que c'est à l'honneur de la
France que ses hommes politiques et ses hauts fonctionnaires ne se
privent pas du droit de parole qui leur appartient, tout autant
qu'à tout citoyen. En revanche, c'est le revers de la
médaille, ce droit de parole implique forcément le
droit de réplique de tous, ce qui justement n'est pas
très français, malheureusement. Je n'ai encore rien
lu dans la presse française de ce que l'on lira ici, qui
coule pourtant de source. — Et mon expérience n'est
pas très positive sur cette question : j'ai
déjà eu droit à une mise en demeure tout ce
qu'il y a de plus juridique du président de l'IMEC pour
être tout simplement intervenu contre une de ses
décisions... juridiques, je le rappelle, s'agissant du
« moteur » du présent
répertoire.
Qu'est-ce donc que cet ouvrage ? Ce
n'est ni un traité, ni un essai. C'est un discours. Un
discours politique. Le personnage, c'est la règle du genre,
n'a rien à dire, aucun fait à rapporter, mais
simplement à exposer des idées et des opinions qui,
à son avis, devraient défendre un projet. C'est
tout. En fait, non, ce n'est pas tout, car les idées et
opinions de l'orateur, qui n'ont pas à être
justifiées, donnent lieu à toutes les
dérives.
En effet, ce discours informel d'une centaine
de pages, daté des 6 au 29 mars 2005, est non seulement
délirant, mais injurieux. Il est délirant, car son
auteur, manifestement, n'est pas bien informé de ce dont il
parle, Google Print dont il ne connaît pas les
éléments fondamentaux (et en cela, il est mal
informé par ceux qu'il sert et qui produiront Europeana
(2007-2008),
c'est évident, une copie conforme de Recherche
de livres de Google); il est injurieux pour son discours
anti-états-unien entièrement construit sur la
dénonciation sans fondement d'une entreprise privée,
Google.
On ne peut pas dire que ce discours soit
structuré. Il est toutefois organisé sur une
dérive qui consiste à développer un virulent
sentiment anti-états-unien, pour ensuite s'en
défendre, en proposant un plaidoyer assez informel pour une
bibliothèque électronique européenne. On a lu
et analysé une à une ces idées plus haut, dans
le texte du ministre Renaud Donnedieu de Vabres, et il n'y a pas de
raison d'y revenir : c'est la hiérarchisation en
fonction d'un prétendu algorithme publicitaire, le vrac, la
mainmise de la culture anglo-saxonne, le fait qu'on soit à
la merci d'une compagnie privée, la nécessité
de l'ordre étatique paternaliste pour éclairer les
choix des citoyens, etc. Bref, ce n'est pas la fable des raisins
qui sont trop verts, mais celle de ceux qui ne sont pas encore
assez mûrs.
En revanche, la rhétorique du
mépris doit être dénoncée. On appellera
cela la rhétorique de l'Élysée. Ainsi,
Jeanneney aurait condamné « d'emblée, et
vertement », dit-il, « tous ceux qui voulaient
voir dans mes propos je ne sais quelle hostilité à
Google » (p. 32). Et voilà ! On s'embrasse.
Quelle hypocrisie que cette rhétorique de
l'Élysée.
En fait, il n'y avait aucun discours à
tenir, aucun livre à écrire : « Il
serait injuste de faire à Google comme à ses rivaux
mineurs un procès d'intention en les taxant d'hypocrisie et
de perversité. Ils jouent leur jeu, celui du milieu
économique où ils prospèrent, celui de la
technologie qu'ils développent, celui du pays où ils
baignent » (p. 104). Sauf pour ces tout derniers
mots, où le mépris est évident, tout le reste
est si juste qu'on ne peut comprendre l'objet du livre.
Question : eh oh! Jeanneney, pourquoi alors faites-vous un
procès d'intention aux politiques de Google en les taxant
d'hypocrites et de perverses, d'impérialistes, page
après page ? Attention, c'est vous qui parlez
d'hypocrisie et de perversité, pas nous.
Cela commence pourtant par le titre du livre
de Jean-Noël Jeanneney. Quand Google défie
l'Europe serait en fait un titre complètement faux qu'il
faudrait lire Google, un défi pour l'Europe. Je vous
jure. Il faut dire que lorsque tu intitules une de tes sections du
sous-titre « Bibliothécaires et libraires :
un besoin d'eux », il n'est pas certain que tu
écrives correctement le français, mais il y a tout de
même des limites à ne pas savoir quel titre on donne
à son ouvrage et quel en est le sens. Le pauvre homme a
découvert que le verbe défier devait
être traduit en anglais non pas par le nom defy, mais
par challenge. Mais alors, pourquoi ne l'écrivait-il
pas en français, dans le titre de son ouvrage ? Tout
simplement parce que nous sommes ici dans la rhétorique de
l'Élysée. Elle consiste à prendre la seconde
moitié de l'ouvrage pour affirmer haut et fort que ce qu'on
lit dans la première moitié n'a rien à voir
avec ses bonnes intentions et en conclusion que le titre du livre
n'est pas celui qui est écrit sur la page de couverture,
mais un autre, Google, un défi pour l'Europe. Quel
nono, cet éditeur, qui n'a pas mis le bon titre.
Les Américains (c'est ainsi que sont
désignés les États-uniens) sont de dangereux
impérialistes. « Impérialisme »,
oui, qui « risque de s'imposer aux dépens de
l'héritage de siècles de sages
réflexions » (p. 11);
« effet de domination, avec cette arrogance plus ou moins
consciente qui en résulte » (p. 15). Bref,
ce sera la domination de l'anglais (p. 60), (« sous
sa forme américaine », sic, p. 13, dans son
« idiome simplifié » comparable au
« grec abâtardi », p. 61; alors que
tout de suite après, il est question du « parler
anglo-américain »), ailleurs de la domination de
la culture anglo-saxonne et de Wall Street (p. 84).
Franchement...
Les Européens (ce sont les
Français, investis d'une mission civilisatrice) ont le
devoir de répliquer à l'impérialisme !
Il s'agit de « notre civilisation », je vous
jure, contre la « civilisation »
« américaine » (p. 15, 49, 57,
105). Il faut réagir contre la « brutalité
d'une uniformisation » (p. 52), aux
« forces obscurantistes qui sont au travail »
(p. 53).
— Sans compter que nous sommes ici
confrontés au cigare de Bill Clinton dans l'affaire toute
mouillée de Monica, toute une affaire (p. 48), et
à la fameuse intervention de Condolezza Rice à
Science Po (sic) le 8 février 2005 (p. 54).
Jean-Noël Jeanneney y était. Notre champion se demande
donc longuement et sérieusement si les Français, la
France, voire l'Europe ne devraient pas réinventer un
« moteur » de recherche susceptible de planter
Google.
Google, c'est les États-Unis.
« Le capitalisme américain tel qu'il fonctionne et
dans la société américaine telle qu'elle se
conçoit » (p. 56). Ces capitalistes ont
négocié des contrats « en grand
secret » (p. 8), notamment avec ces infects
Roast-Beafs Britanniques (la Bodleian d'Oxford !,
p. 8-9), « solidarité anglo-saxonne qui nous
est familière », de la part d'un pays propre
« à regarder vers le grand large plutôt
qu'à se tourner vers le continent en quête de
patriotisme européen de notre aventure en marche »
(p. 9, textuel, je vous jure). La compagnie se livre à
une procédure que, dit-il, « j'allais dire
maligne » (p. 41) : grosse entreprise,
populisme culturel, hiérarchie publicitaire, hyperpuissance
(oui, oui, Google), hégémonie américaine,
etc.
Google, en plus, a un employé du nom
fameux d'Adam Smith, on l'a vu. Comme on sait, l'économiste
croyait aveuglément, dit-on, aux lois du marché. Tel
n'est pas le cas des citoyens de la République et de
l'Europe. Oui, je sais, je deviens grossier et vous ne pensez pas
que monsieur Jean-Noël Jeanneney puisse se livrer à un
tel amalgame par le biais d'un jeu de mot sur un nom propre. Alors
je le cite au texte, honte à lui : « J'ai
souri en notant qu'un des membres de l'équipe dirigeante de
Google répondait au nom d'Adam Smith : homonyme du
célèbre économiste anglais, inventeur au
XVIIIe siècle de la théorie de la main invisible.
[...] Nous n'avons pas ces convictions-là. L'Europe, dans
son ensemble, ne fait pas cet acte de foi »
(p. 34-35). Suivent trois pages contre « le
libéralisme américain à la mode de
l'école de Chicago » (p. 36),
c'est-à-dire Smith, Google et les États-Unis. Nous
sommes ici et depuis longtemps en plein délire,
évidemment.
Si l'on en vient à l'essentiel, on se
retrouve avec l'annonce faite à Jean-Noël Jeanneney
— l'annonce faite à Marie, au Monde (p. 9) et
à la planète (p. 56) —, en décembre
2004. Et le voilà à s'énerver le poil des
jambes,
alors que le projet de Google est connu depuis longtemps. Mais
voilà aussi pour lui l'occasion, sans le savoir, d'exprimer
son plus parfait mépris pour la
« civilisation » qu'il appelle
« américaine ». Cela s'appelle, je
crois, dépasser les bornes.
— On trouve, à quelques endroits
stratégiques de son discours, de très précises
évocations du « respect des droits des auteurs et
des éditeurs » (p. 9), « droits des
auteurs et des traducteurs » (p. 102), la
« crainte compréhensible des éditeurs
d'être par là spoliés »
(ibid.). Mais le président de la Bibliothèque
nationale n'avait pas besoin d'en rajouter : le Groupe de La
Martinière sait qu'il pourra compter sur son appui contre
Google.
Communiqué de presse
Le Syndicat national de l'édition a décidé, au
nom de la défense des intérêts de ses
adhérents (1), de s'associer à
l'action en contrefaçon engagée par le Groupe La
Martinière (2) contre le moteur de
recherche (3) américain (4) Google qui a numérisé (5) massivement (6) et mis
à la disposition du public sur le réseau
Internet (7), sans autorisation
préalable, une partie des fonds des éditeurs
français (8). Le SNE a, depuis le
mois de janvier 2006, dénoncé publiquement de tels
agissements qui contreviennent aux règles essentielles du
droit de la propriété intellectuelle (9).
Le Syndicat national de l'édition
Paris, le 7 juin 2006
115, boulevard Saint-Germain, 75006 Paris
Téléphone : 01 44 41 40 50 —
Télécopieur : 01 44 41 40 77
(1) C'est clair. Ce ne sont pas nos
intérêts, ceux des lecteurs, ce ne sont pas les
intérêts de la société. Ce sont les
intérêts corporatistes des
« adhérents ». C'est beau, la
clarté.
(2) Ce groupe est le propriétaire des
Éditions du Seuil, Paris, dont nous avons tous acheté
des dizaines de livres. La maison de la rue Jacob. Quelle
misère. Ainsi, ce sera plus clair : dans ma famille,
on dit, nourrissez un cochon, il viendra chier sur votre perron.
(3) Système de recherche. Moteur de
recherche : je me demande toujours ce que viens faire
l'idée de « moteur » là-dedans.
C'est pas clair...
(4) Américain pour états-unien et,
ça, c'est vraiment clair : en France, on ne sait pas
encore que l'Amérique, c'est vaste ! En
Amérique du nord, les Mexicains, les États-uniens,
les Canadiens et les Québécois sont des
Américains. Je veux bien croire que Google a son
siège social en Californie, mais ce n'est pas une raison
pour le qualifier d'« américain ».
Tiens ! Le SNE, le syndicat européen...
(5) Numérisé, pour
digitaliser, c'est
scanner.
(6) Massivement, vraiment ? C'est pas clair...
(7) Totalement faux et même
complètement loufoque. On le voit clairement en consultant
le serveur Recherche de livres de Google.
(8) Le syndicat européen (je
m'amuse !) parle-t-il au nom de ses adhérents ou de la
République française ? Il faudrait donc lire
« une partie des fonds des Éditions du Seuil,
prétend son propriétaire, et de nos autres
adhérents », n'est-ce pas ? Sinon, ce n'est
pas clair.
(9) Il faudrait être clair : la
« propriété intellectuelle »,
cela n'existe qu'en France. Ailleurs, c'est le droit de
reproduction qui importe.
|