20 Minutes référence ses articles par intelligence artificielle

20 Minutes va intégrer de l’intelligence artificielle (IA) dans son nouveau back-office pour valoriser ses articles sur le web et faire gagner du temps à ses journalistes. Cette initiative s’inscrit dans la continuité de la stratégie data du média.

| Cet article fait partie du dossier « Nouvelles stratégies data et RGPD : Une route encore bien longue »

Winoc Coppens, DSI de 20 Minutes.

Winoc Coppens, DSI de 20 Minutes.

À partir de cet été, les journalistes du quotidien d’informations 20 Minutes bénéficieront d’un nouveau back-office qui automatisera certaines tâches rédactionnelles grâce à de l’intelligence artificielle (IA). Les algorithmes proposeront, lors de la publication des articles, l’ajout d’un titre, de photos ou de liens. « Nous utilisons l’IA comme un service ou une API nous permettant de gagner en efficacité », indique Winoc Coppens, directeur des systèmes d’information, lors d’une réunion du Club de la presse informatique B2B.

Cela fait trois ans que 20 Minutes élabore une stratégie autour de la data. « Cette époque a été marquée par l’arrivée d’un data analyst, qui a créé un data lake nous permettant de déterminer qui vient voir quel article et sur quel support », précise Winoc Coppens. Ces informations et la gestion des statistiques du site ont permis au média de réaliser des projets en lien avec de l’IA. Un chatbot a notamment été créé pour l’élection présidentielle de 2017 et les articles sur le sujet ont été traduits automatiquement en anglais.

Des titres rédigés par de l’IA

Guide RGPD et collaborateurs

Le quotidien s’est d’abord concentré sur l’application de l’intelligence artificielle au bénéfice du lecteur. L’équipe IT a cherché à proposer un contenu adapté aux goûts de ses visiteurs. « Cela n’a eu aucun résultat car les lecteurs veulent du breaking news en venant sur notre site », reconnaît Winoc Coppens. Un deuxième essai, portant sur de la recommandation d’articles, a été mené par la suite… lui aussi s’est soldé par un échec.

L’idée d’appliquer une solution d’IA du côté des journalistes s’est alors imposée. Au moment de la publication, un algorithme analyse l’article et soumet à son auteur un titre, une photo d’illustration issue de la bibliothèque d’image, un texte d’annonce et des liens hypertexte. « Le journaliste associe à son article des liens qui peuvent ne plus être pertinents au bout d’un certain temps. L’algorithme sélectionne ceux à ajouter et peut les modifier si l’actualité évolue », explique Winoc Coppens, qui se réjouit de cette possibilité.

L’IA, dans un rôle d’assistant SEO, attache également à l’article des mots-clés pour optimiser son référencement sur le web. « Les métadonnées sont pour nous un vrai sujet : avec l’essor des robots dans le traitement de la data, il faut que nos articles soient parfaitement renseignés », souligne le DSI.

Un test, avec une solution de machine-learning développé avec Keyrus, est effectué depuis plusieurs mois auprès de cinq journalistes, avant la généralisation de cette fonctionnalité dans le back-office. « L’IA est compliquée à mettre en place car il s’agit d’un concept nouveau. Il faut faire de la pédagogie sur son usage et déterminer comment est-ce que cela peut faciliter le travail au quotidien car on en demande toujours plus à nos journalistes », analyse avec lucidité le DSI.

« Inculquer une culture data »

La donnée est ainsi devenue essentielle dans l’organisation de la rédaction. Les journalistes, tous devenus multimédia, ont accès à divers tableaux de bord pour adapter le contenu de leurs sujets selon le canal – web, mobile ou réseaux sociaux. « Fin 2017, nous avons installé dans le hall d’entrée un compteur indiquant le nombre de pages consultées pour sensibiliser les journalistes à l’importance de la data. Nous avons par ailleurs institué une rédactrice en chef en charge de l’animation des réseaux sociaux et un comité numérique qui se réunit chaque semaine, témoigne Winoc Coppens. Tout est fait pour inculquer une culture data. »

Cette stratégie va néanmoins être repensée avec l’entrée en application du règlement général sur la protection des données (RGPD). Aujourd’hui, 20 Minutes étudie l’ensemble des données des lectures, ce qui représente des téraoctets de données. « Avec le RGPD, nous allons devoir nous concentrer sur les visites anonymes parmi nos 16 millions de visiteurs par mois », confie Winoc Coppens, qui a commencé à définir des règles métiers à cette fin.