[Chronique] Lorem Ipsum… Au cœur de la bataille des mots sur Internet et du capitalisme linguistique

Notre chroniqueur François-Xavier Petit analyse le poids de la linguistique dans l’état actuel de notre économie à l’ère internet : du fameux lorem ipsum au SEO, en passant par la vision de Google, quelles batailles se jouent aujourd’hui ?

LoremLorem ipsum dolor sit amet… Ces quelques mots m’interrogent toujours quand je vois des sites en construction ou des maquettes de designers. Non pas seulement pour savoir d’où ils viennent – une rapide recherche répond à cette question – mais surtout pour comprendre ce qu’ils disent de notre langue entraînée dans la grande nébuleuse de l’internet.

En fait, qu’y-a-t-il vraiment derrière le lorem ipsum ? Tout le monde connait cette locution aperçue ici ou là, en ligne ou pas encore, dans une présentation « in progress » ou sur une maquette. Lorem ipsum, c’est d’abord une pratique, un code professionnel pour combler les pavés de texte manquant, en attendant que ceux-ci soient finalisés ou validés. Les designers et développeurs les utilisent pour calibrer les textes et avoir un premier visuel de l’effet rendu.

L’Histoire au service d’un objet à part de l’internet

Mais qu’est-ce qui nous amène là, à déployer ce texte sans sens dans un internet où, au contraire, il me semblait que tous les mots devaient être choisis avec la précision d’un horloger suisse pour obtenir le meilleur référencement possible ?

D’abord, il s’agit d’une ancienne tradition. Ce texte aléatoire a été composé par un imprimeur du XVIe siècle dans un but identique à celui d’aujourd’hui : des essais typographiques (en l’occurrence, il s’agissait de réaliser un livre spécimen de polices de texte). Le passage – même s’il s’agit de texte aléatoire – est à rapprocher d’un traité de Cicéron datant de 45 av JC : De Finibus Bonorum et Malorum (Des suprêmes biens et des suprêmes maux), un ouvrage répandu à la Renaissance, période de redécouverte et d’engouement pour les textes latins. Le passage est le suivant « Neque porro quisquam est qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit… » (« il n’existe personne qui aime la souffrance pour elle-même, ni qui la recherche ni qui la veuille pour ce qu’elle est… »). On y repère donc des éléments qui entrent la composition du lorem ipsum.

Ensuite, la pratique du lorem ipsum est développée dans les années 60 par l’impression et la diffusion de feuilles Letraset, puis par l’inclusion de lorem ipsum dans des logiciels de mise en page. Aujourd’hui, des sites proposent de générer des lorem ipsum, d’ailleurs avec une certaine concurrence entre des générateurs, certains insérant de l’humour ou des références, d’autres les refusant. Le lorem ipsum est devenu un objet à part entière.

La langue comme un code pour produire une autre forme de code

Alors on peut interpréter. Notons ici que le numérique dans son rapport à la langue cherche dans le latin une base universelle – position qu’il occupa avant le français puis l’anglais – mais surtout une codification, comme le latin de messe du Moyen-Âge que les fidèles ne comprenaient pas mais qu’il récitaient par cœur. La langue comme pure code. Et c’est peut-être le plus intéressant : la langue comme un code, justement pour produire un autre forme de code, un point de passage, qui sépare le signifiant (mot), du signifié (sens) ; qui impose même de ne pas comprendre pour ne pas laisser son esprit être distrait par du texte qui a du sens. En effet, on pourrait imaginer prendre un passage des Misérables pour calibrer du texte, mais le risque est de se laisser entraîner par le sens. Au moins, le latin – et qui plus est un faux latin – évite ce piège du sens tout en déployant des vrais mots.

De fait, l’intérêt du lorem ipsum est de disposer de vrais mots (même aléatoires) qui donnent l’effet d’un texte auquel le regard est habitué. En utilisant de vrais mots et une vraie ponctuation, on peut aussi calibrer les espaces entre les caractères de manière fluide, là où « blablabla blablabla » ne le permet pas.

Les mots ont-ils si peu d’importance dans l’internet d’aujourd’hui ?

Pour autant, le lorem ipsum n’est pas exempt de reproches. Certes, il permet de calibrer un texte mais, en même temps, personne ne lit ce texte. De fait, voir lorem ipsum indique immédiatement que lire ne sert à rien. C’est ce que l’on appelle la fonction phatique d’un terme (comme dire « allô » en décrochant le téléphone : ça ne veut rien dire mais c’est un code qui établit la communication). Donc se rendre compte de l’ergonomie d’un site, de la longueur d’un texte ou du besoin éventuel d’intertitres semble assez hypothétique du fait même du lorem ipsum. Ici le code se mord un peu la queue.

Mais j’en reviens à la question du début. Les mots ont-ils si peu d’importance dans l’internet d’aujourd’hui ? Le lorem ipsum pourrait laisser à le penser, truffant les sites en construction et autres maquettes figma de textes aléatoires et interchangeables. La dynamique linguistique de l’internet semble pourtant bien plus sensible aux mots. Le SEO suffit à s’en convaincre : le choix pertinent des termes améliore (ou non) le référencement, donc la visibilité, le trafic, le commerce… Certes, mais de quels mots s’agit-il ? Quelle est la linguistique d’internet ?

Ce qui est intéressant ici, c’est le caractère régularisé du lorem ipsum : un texte universalisé et utilisé comme un code répliqué à l’infini, détachant son sens de sa signification. Et là, on touche quelque chose. La linguistique d’internet procède par régularisation des mots et leur codification. L’exemple du SEO donné ci-dessus démontre la même chose : il s’agit d’insérer dans son texte des mots-clés qui permettent de se glisser dans les requêtes les plus fréquentes et ainsi de remonter son référencement. Là encore, le texte se code et le sens (ce que la phrase veut dire) s’éloigne de la signification (accrocher un bon référencement et arriver plus haut dans Google). D’ailleurs la rédaction SEO s’impose comme une vraie discipline à part entière.

Les mots moteur de la valeur dans notre « capitalisme linguistique »

Cette régularisation du texte apparaît à d’autres niveaux. Par exemple, quand vous avez fait une « fote » de frappe ou d’orthographe, Google vous suggère « essayez avec cette orthographe : faute de frappe ». Est-ce parce que Google veille sur notre orthographe et nous aide à mieux écrire ? Non – ou pas prioritairement – c’est parce qu’un mot mal écrit dilue ce qui pourrait devenir un mot-clé s’il était toujours écrit de la bonne manière (et donc statistiquement plus représenté).

Aussi se dévoile ici tout un pan des moteurs de recherche : le fait que ce sont les mots qui créent de la valeur. Michel Serres avait déjà attiré mon attention en disant ceci : depuis Richelieu, l’Académie française publie, à peu près tous les quarante ans, son dictionnaire. Aux siècles précédents, la différence entre deux publications s’établissait autour de 5000 mots. La prochaine édition en aura 30 000 d’écart. Les mots sont le moteur de la valeur. Et ce sont même précisément les mots qui ont rendu Google aussi riche, au point que le chercheur Frédéric Kaplan a parlé de capitalisme linguistique. De fait, si PageRank classe les requêtes, la richesse de la firme de Mountain View vient d’ailleurs.

Car les requêtes ne produisent pas qu’un classement des sites par pertinence. Elles ouvrent aussi vers de la publicité. De l’autre côté de l’écran de l’internaute, les annonceurs choisissent des mots-clés auxquels ils aimeraient voir associer leur publicité, et ne paient d’ailleurs que quand l’internaute clique sur le lien. Mais le plus fascinant est qu’un processus complexe se joue en une fraction de seconde : celui d’enchères en plusieurs étapes.

D’abord l’enchère sur un mot-clé, et la fixation du prix maximum que l’annonceur accepte de payer. Google assiste cette étape en proposant des prix.

Puis Google attribue une score de qualité (échelle 1 à 10) en fonction de la pertinence du texte publicitaire au regard de la requête). C’est, en somme, mesurer à quel point la publicité fonctionne.

Alors se fait le troisième calcul, celui du rang d’apparition, en multipliant l’enchère par le score. Ainsi, une enchère plus faible peut être compensée par un score plus élevé. C’est le génie de cet algorithme.

Une bataille linguistique à chaque seconde dans nos ordinateurs

Internet s’affiche donc comme une vaste « bourse des mots », pour citer encore l’excellent travail de Frédéric Kaplan.

La force de Google est de savoir classer et écouter les recherches des internautes pour faire évoluer le score et l’algorithme, car celui-ci est en évolution permanente en fonction des tendances et des recherches.

La langue est devenue un marché mondial, spéculatif, et nourri de tout ce que Google analyse, des emails envoyés via Gmail au contenu des GoogleDoc, pour affiner sans cesse les algorithmes. Alors voilà pourquoi on régularise l’orthographe. « Fote » n’a pas de valeur « Faute » en a pour placer de la pub pour des cours de remédiation orthographique ou pour acheter un Bescherelle. Il en va de même quand Google suggère la fin de la phrase. Le but est d’engager l’internaute à prendre un chemin linguistique et statistique tracé par d’autres pour entrer dans le processus lucratif de l’enchère.

Internet nous invite à une économie de l’expression, régularisée, codée, mise en statistique et en enchères, déformée par le besoin de mot-clé, par l’achat d’un nom de domaine disponible, comme par le « jugement » d’un algorithme qui estime que votre expression correspond à telle ou telle requête.

Voilà pourquoi l’anodin lorem ipsum, a priori bien neutre, est en réalité une petite lucarne sur la bataille linguistique qui se joue à chaque seconde dans nos ordinateurs.