Carrefour Links valorise un asset Data “unique en Europe”

En 2021, le groupe Carrefour lançait sa plateforme 100% cloud Carrefour Links. Son objectif : valoriser ses données auprès de partenaires industriels et développer des offres retail média. 

Article Carrefour DataLa donnée présente de multiples usages dans les organisations. Elle peut notamment être valorisée pour répondre à des besoins internes. Elle est aussi monétisable au travers de la fourniture de services digitaux.

A lire aussi : Une stratégie « API first », clé de voute d’échanges de données ambitieux

C’est sur cet axe que travaille le groupe Carrefour depuis 2021 au travers du lancement de Carrefour Links. Cette activité axée sur le retail média (un marché de 14 milliards de dollars en 2021) repose donc sur une plateforme. Et celle-ci exploite pour son fonctionnement l’important actif Data dont dispose le distributeur.

10 milliards de tickets de caisse à explorer

L’entreprise a détaillé le modèle économique, organisationnel et technologique de Carrefour Links à l’occasion d’un atelier organisé durant le salon Big Data Paris. L’acteur s’appuie notamment sur une base de données de 10 milliards de tickets de caisse, “une source d’analyse extrêmement intéressante”, comme la qualifie Ancelin Lacroix, directeur des opérations de Links.

A cette base s’ajoutent les données des détenteurs de cartes de fidélité (50 millions sur 9 pays) et des données issues de sa chaîne logistique (3 millions de produits en stock, 23 millions de mouvements de stocks quotidiens…).

“Depuis des années, nos équipes travaillent à consolider, agréger, structurer et mettre en qualité cette donnée”, souligne le cadre de Carrefour. Ce patrimoine est stocké dans un Data Lake, mais “à un niveau très granulaire, à la maille de la ligne de ticket et sur un modèle de données 100% homogène sur 9 pays.”

La mission centrale de Carrefour Links consiste donc à exploiter cet “asset unique en Europe” par le biais d’un ensemble de solutions et de services. Ces produits sont destinés aux clients de l’enseigne, aux équipes Carrefour, aux partenaires de la grande distribution, et aux annonceurs.

Afin de valoriser cet actif stratégique, l’entreprise a développé trois lignes de produits principales :

  • Insights pour la fourniture de solutions d’analytics permettant à ses clients d’analyser la performance de leur business et de comprendre le comportement des clients.
  • La donnée est partagée pour une organisation des relations avec les partenaires industriels dans un mode data driven. La Data intervient par exemple pour orienter le choix des assortiments ou dans le but d’optimiser bout-en-bout la supply chain.
  • Retail Media, soit la publicité et le marketing appliqués au retail. Données et espaces publicitaires (physiques et numériques) sont exploités “pour activer de façon plus pertinente les clients.”

Une stack techno Cloud et KISS

Sur le volet Insights, Carrefour Links a donc développé une première solution, Data Shopper, c’est-à-dire de mise à disposition de données et d’indicateurs. Les clients du produit analytics accèdent à un tableau de bord de 160 métriques. Ils peuvent aussi explorer et exporter de la donnée pour réaliser des analyses personnalisées.

A noter que l’entreprise développe actuellement un deuxième produit orienté sur la supply chain. Il vise à partager de la donnée, soit “une vision commune”, sur la détention, les niveaux de stock et les taux de service. 

Pour concevoir ces offres, Links a donc conçu une stack technique, une plateforme Data en mode 100% cloud hébergée sur Google Cloud Platform (GCP). Ce sont ainsi plusieurs pétaoctets de données qui sont stockés et traités sur BigQuery en mode asynchrone (via du batch).

Carrefour Links

En termes de stack technologique, son CTO Medhdi Labassi revendique une approche KISS [Keep It Simple, Stupid] dans une optique de maîtrise et d’industrialisation. Elle se compose notamment d’un Datawarehouse BigQuery, de l’outil DBT pour la transformation des données, et de Looker sur la modélisation et la data visualisation.

“C’est très simple… mais en fait ce n’est pas si simple. Pour deux raisons : Il s’agit de produits commerciaux. On fait de la data pour la vendre. Nos fournisseurs paient pour avoir accès aux métriques. Le niveau de qualité doit donc être irréprochable. Deuxième raison : nous sommes sur des volumétries assez importantes et sur des données très hétérogènes”, souligne le directeur technique de Links.

Carrefour doit ainsi relever trois défis principaux. Il lui faut impérativement fournir à ses clients une “expérience premium”. L’entreprise a fixé comme ambition d’afficher ses 160 métriques sur l’interface en moins de 15 secondes. Le dashbord doit aussi permettre une exploration des données remontées par les 9 pays du groupe à J+1.

Des filiales pays owners des données et responsabilisées

Les filiales ont un rôle important à jouer dans ce cadre. Elles sont à ce titre les owners des données. Elles veillent à respecter le modèle de données défini au global, à la qualité de leur actif et à son transfert vers la plateforme.

Pour cela, Links a mis en place “des pipelines de qualité industrielle”, et aussi développé un framework maison baptisé CLEAR pour monitorer la qualité des données. “De nombreux contrôles sophistiqués sont appliqués” sur 5000 tables chaque jour.

“C’est l’owner qui est responsable de la qualité. En cas de problème, un ticket est ouvert dans le pays concerné pour qu’il répare”, précise Medhdi Labassi. Pour répondre à ces défis, les données doivent être “travaillées”, “documentées” et remontées dans l’outil de modélisation Looker.

Afin de permettre leur restitution rapide dans le produit Insights, une couche intermédiaire a été intégrée pour procéder à une préparation des données. Sur les pipelines, qui traitent chaque jour 2 Po de données, des automatisations ont été déployées. 

Links reflet de la maturité Data de Carrefour

En matière de méthodologie et d’organisation, Ancelin Lacroix insiste sur l’importance d’adopter une approche produit, c’est-à-dire client-centric et reposant aussi sur des équipes cross-fonctionnelles (Data, métier, développement…).

Le directeur des opérations précise en outre que des pratiques (Hubs & spokes) inspirées des communautés open source ont été adoptées, notamment afin de favoriser le partage de code et la réutilisation, plus largement.

Une stratégie Data nécessite enfin des compétences. Carrefour développe dans ce domaine des expertises en interne via de nombreux recrutements, accompagnés par une politique RH d’attractivité. Afin de fidéliser et faire monter en compétences ses ingénieurs, le distributeur met aussi l’accent sur les formations et les certifications.

Au cours de leur première année dans l’entreprise, les recrues bénéficient chaque mois d’une à deux journées de formation, sur la “partie technique, mais aussi le business”. Enfin, le lancement en 2021 de la plateforme Links s’avère structurant pour l’ensemble du groupe, comme le souligne Medhdi Labass :

“Links est le reflet de la maturité globale de Carrefour en termes de Data”. Mais, c’est aussi “un levier d’amélioration”. Pour développer ses offres Data, créer de nouvelles sources de revenus et mieux monétiser son actif, la maturité Data doit progresser sur différents axes et à l’échelle du groupe.