des chaises en plastique dans la tête

algorithme Google page pratique, et visage d’icelui


C’est l’avantage du Net : les informaticiens s’exposent via blog, c’est naturel presque et ils sont entre eux, mais à nous de se mettre à l’écoute quand ils se préoccupent aussi d’édition ou du livre.

L’algorithme de recherche de Google est défendu mieux qu’un secret militaire. Pensez : l’argent des publicités, la vente de mots classés à échelle planétaire, la diffusion de vidéos en ligne et tant d’autres profits centralisés. Et qu’ils ne restent pas les plus pertinents, tout se dégonflerait aussi vite que ça a commencé.

Je m’en souviens, de quand ça a commencé : on se servait du moteur de recherche de Yahoo ou d’Altavista, et d’un coup on se repassait le tuyau, on installait sur nos sites perso le petit code de recherche avec l’icône Google, ça a d’ailleurs été un des éléments de leur démarrage, de nous laisser installer l’accès Google sur nos pages du grand désert.

Il n’y a qu’à voir les efforts que fait l’ami Bill pour courir derrière, avec cette demoiselle Dewey dont j’espère qu’elle s’est fait rémunérer selon pourcentage de trafic Microsoft engendré.

L’algorithme Google est compliqué : il prend en compte, plutôt que les mots-clés autrefois intégrés en tête de pages (que certains utilisaient comme une arme en retour, voir d’aucuns fichiers source) le nombre d’occurrences du mot cherché dans les premiers 1500 caractères de la page, avec surévaluation s’il figure dans le titre. Par exemple, au début, Valère Novarina n’apparaissait pas dans Google via son propre site : puisqu’il s’agissait de son propre site, à quoi bon répéter son nom à toutes les pages ? Google a pris son élan en comptant le nombre de liens qui pointent vers votre page : plus elle est considérée par d’autres sites, plus elle grimpe dans le classement. Mais on évite le link farming, par exemple, les liens qui pointent de mon site publie.net à tierslivre.net puisqu’ils me sont attribués tous les deux. On est capable aussi de moduler l’importance d’un lien selon le classement du site qui l’accueille, allez courir si c’est vos trois copains de blogs qui vous placent en lien, ou bien selon le nombre d’autres liens figurant sur la page : si ma page liens envoie vers deux cents autres, ils seront petit coeff, désolé…

Compte aussi la fréquence de mise à jour et de renouvellement d’un site (donc, pour Tiers Livre, ça va), et de façon plus mystérieuse les flux de consultation, et probablement leur localisation géographique : le géocentrisme avec centre gravité USA, ça s’algorithme aussi. En France, on doit encore avoir un coeff honorable, mais je prendrais un hébergeur US je gagnerais certainement ! Plus bizarre, l’ancienneté semble un critère essentiel : les vieilles URL c’est comme les vieilles marmites, c’est là qu’on fait les meilleures soupes d’après eux.

Ensuite, c’est une sorte de jeu : si chacun sait comment anticiper les réactions des robots de Google, ça ne vaut pas, alors il déplacent sans cesse leurs règles, à nous d’essayer de piger. En ce moment, ils parlent surtout de nouvelles données : ce que Google archive, c’est bien plus que le contenu des pages, bien plus que balayer les pages et en copier les mots. Ce que Google collecte à travers une page, fréquence et durées des visites, leur origine et leurs variations, c’est probablement là aussi leur jeu de piste en ce moment. Mais c’est un grand géant myope et maladroit : on le voit lorsqu’il s’agit pour eux, via AdSense, de trouver les pubs qui peuvent aller avec un site.

Donc, côté Google, ils affinent. La nouvelle mouture de l’algorithme s’appelle BigDaddy, elle est déjà en service sur leurs serveurs centraux, et maintenant je sais pourquoi ce nom-là : c’est expliqué dans le blog de son boss.

Autrefois, paraît-il, il a suffi d’un garage et de trente-cinq disques durs, déjà du jamais vu, pour archiver le Net. On repérait facilement, de notre côté, les actualisations de nos sites sur Google : Google passait tous les douze jours environ, il avait balayé entre temps la totalité mondiale de l’Internet et s’était arrêté chez vous, on en était presque ému, oui. Maintenant, c’est à peu près tous les quatre ou cinq jours, et même moins. Et probablement les flux d’archivage, dans ce système dit des ailes de papillon (le ventre central exploré plus souvent, les extrémités des ailes plus rarement : ainsi, mieux avoir son propre url que d’être hébergé par une centrale de blogs) sont de moins en moins aléatoires : ça ressemble à quoi, les lieux Google dans nos campagnes ? Un entrepôt climatisé anonyme, un silo souterrain ? Un château d’eau désaffecté près d’Ivry comme les affectionne Echenoz ? Il faudrait demander à Philippe Vasset.

Donc je suis allé, via Google, prendre des renseignements sur BigDaddy, et surprise, voilà leurs binettes : une salle de réunion bien tristounette, vingt-huit personnes dont quatre femmes (ah bon, et c’est très white white aussi), autour du cerveau principal de Google, les fondateurs s’occupant plutôt de finances, ou de vidéo, dit lui-même qu’il est le gars là au milieu, avec la chemise bleue.

Eh bien on est heureux à son blog. D’abord il offre pas mal de petites services : où est-ce qu’on peut manger bien et pas trop cher le midi dans la Silicon Valley, et les menus. C’est marrant, c’est juste à côté d’Apple et quelques autres : ça tient dans un mouchoir de poche, la loi du monde. Et puis moi je n’aimerais pas y manger tous les jours, dans la Silicon Valley : je préfère chez Fernand à Pantin (rue Cartier-Bresson, on recommande).

On a affaire à un homme comme les autres. On comprend qu’il est marié et père de famille, tant mieux et cela ne nous concerne pas. C’est quand même plus étrange de le voir se photographier et archiver, parmi les activités qui résument dans une seule paire de mains sur un clavier le destin de nos bibliothèques entières, le déguisement qu’il porte à chaque Halloween, au bureau. Quand il parle de musique, BigDaddy, il se préoccupe plutôt des questions logicielles, laissons. On ne va pas lui demander ce qu’il pense de Giacinto Scelsi.

Qu’il n’a pas tout notre destin dans ses mains ? Plus personne, lorsqu’on s’interroge sur un livre, un lieu, un programme, un nom, pour ne pas d’abord passer voir dans Google (c’était le sens de ma surprise, la semaine dernière, à voir combien peu d’écrivains considèrent d’importance de prendre en charge eux-mêmes ce minimum, à savoir ce que diffuse de vous Google). Et vous pouvez même faire une faute d’orthographe dans le nom, BigDaddy vous aidera à vous repérer dans les variantes.

Il nous dit ce qu’il lit, l’ami. Mais pour lui, par exemple, livres et magazines c’est la même chose, alors que moi je considère cela comme différent. On entend souvent ça, dans les kiosques de gare, des gens qui disent : — Attends, j’achète un bouquin, et qui prennent un magazine pour leur lecture ferroviaire. Il vous dirait, BigDaddy, que la littérature pas le temps. Nous ne lui en voulons pas. Quand bien même mon immense bonheur, ces jours-ci, à relire Allen Ginsberg (et découvrir son Chute de l’Amérique, quel génie, quelle vie) ou ce que j’estime vital chez Raymond Carver, et d’autres de chez eux, pas si loin de Big Daddy. Il retient du samedi 11 novembre l’annonce du divorce de Britney Spears juste à égalité des élections américaines mais bon, je fais un peu la même chose dans mon carnet...

Comprenez, je ne lui en veux pas, à cet homme. Je suis content de savoir son visage, et qu’il n’ait rien d’effrayant, de conspirateur, de sorcier maléfique. Peut-être même que sa manière de se présenter sur son blog est celle d’un honnête homme au vieux et noble sens du terme. Mais pas plus. Un chercheur, attentif à ce qui l’entoure et qui pourra se dire avoir bien œuvré, de façon positive. On ne peut pas faire ce travail, à ce lieu et sur un tel outil, sans une curiosité ouverte.

Après tout, Internet ce n’est pas d’abord un outil de civilisation : vous avez vu, la semaine dernière, dans l’ordre, les 5 sites français les plus consultés, Anpe, Meetic, Caf, Prison break et Plus Belle la Vie...

Ce qui m’interloque, c’est la disproportion. Entre les mains de ce petit groupe, autant de ce qui nous concerne, et nous concerne sur le fond, avec possibilité d’effondrements sauvages susceptibles d’absorber pans entiers de vieille civilisation. La question de la langue, l’hégémonie d’une seule langue, cela se réfléchit certainement chez eux dans la même salle : l’ami informaticien, Julien Kirch, vous tiendra au courant de la révision utf-32 au lieu de notre bon vieux code iso-8839 qui codait sur les machines nos circonflexes et trémas ou cédilles de la langue française. Mais voilà, ce n’est pas comme cela que je porte mon attention à la langue.

Je n’ai pas peur de Google, et on peut avoir en estime le travail de ces hommes, on est tous conscients de ce qui se joue là de technologie, en telle et perpétuelle évolution.

Mais je pensais à Robert Musil : L’Homme sans qualités et à la révision du titre qu’avait proposée Maurice Blanchot : L’Homme sans particularités.

Faites connaissance avec BigDaddy et leur chef d’équipe, un type bien je vous dis. Mais. Il y a quand même un mais.


responsable publication François Bon © Tiers Livre Éditeur, cf mentions légales
diffusion sous licence Creative Commons CC-BY-SA
1ère mise en ligne et dernière modification le 15 novembre 2006
merci aux 4186 visiteurs qui ont consacré 1 minute au moins à cette page