Data Mesh : une transition au fil de l’eau pour Suez

Le Data Office de Suez, créé en 2019, a d’abord mis l’accent sur la culture Data, la formation de leaders et la gouvernance. Depuis 2022, la Chief Data Officer Claire Mathieu développe une nouvelle plateforme et la mise en œuvre des piliers du Data Mesh.

Claire Mathieu, la Chief Data Officer de Suez

Claire Mathieu, la Chief Data Officer de Suez

Malgré une OPA et un changement à la tête du Data Office de Suez, la transformation Data entamée en 2019 reste un chantier stratégique au sein de l’entreprise. L’action dans ce secteur porte sur 4 piliers : gouvernance, analytics, plateforme et culture.

Sur la gouvernance, l’industriel a donc défini des rôles en interne  – et dont la principale mission est de superviser la qualité des données. Parmi ces rôles rattachés aux métiers, des data owners, des data stewards et également des lead data stewards (pour les données transverses).

Les gardiens du temple en place dans l’organisation

“Le Data Office est là pour aider les équipes métiers à s’organiser autour de la data, à identifier les données référentielles à intégrer aux Master Data (…)”, indique à Alliancy.fr Claire Mathieu, la Chief Data Officer de Suez.

Gagner en maîtrise sur la qualité, installer des “gardiens du temple” et construire “des définitions communes”… L’entreprise revendique la mise en place d’un framework de gouvernance. “Les résultats sont satisfaisants. La communauté grossit”, se félicite la CDO.

Sur le pilier de l’architecture, Suez est confronté à une situation récurrente parmi les entreprises dotées d’un legacy avec des données en silos et difficilement accessibles. Ce résultat est aussi la conséquence d’intégrations successives d’autres sociétés. La duplication était aussi une pratique fréquente. Quant à l’usage, il portait principalement sur la production de rapports BI.

“Une discussion avec les équipes métiers, au plus proche du terrain” a cependant fait émerger d’autres besoins. “Le reporting n’était plus suffisant pour elles. Il leur faut pouvoir croiser des données de différents univers”, souligne Claire Mathieu. Générer ces croisements nécessite généralement de solliciter l’IT, allongeant le cycle de production de nouveaux reportings.

Le Data Office veut changer la donne. Il a sondé le terrain. L’opportunité de constater que beaucoup d’initiatives de récupération de données avaient été enclenchées isolément. Et les besoins concernent souvent des données volumineuses et répondant à des mêmes besoins.

Ce bilan a fait émerger la nécessité de constituer un même espace fédérant les données tout en “redonnant la main aux métiers.” L’intérêt pour le concept de Data Mesh et ses produits de données mutualisés garantissant de “l’autonomie” aux équipes est ainsi né chez Suez.

Le Data Mesh et la mutualisation des données

Data Mesh - Suez Cette prise de conscience s’inscrit dans un cycle de maturité et s’appuie sur des fondations. “Les deux premières années, nous avons construit notre méthodologie et aussi notre réseau (…) Pour montrer l’intérêt de la Data, nous nous sommes appuyés sur un 3e pilier qui est celui de la culture”, indique la CDO.

Formation des leaders, réalisation de projets, y compris à base d’intelligence artificielle… le Data Office a sensibilisé les décideurs et démontré la valeur. En 2020, malgré le Covid, Suez a installé une communauté Data au sein d’une BU au Royaume-Uni. Celle-ci est devenue “le fer de lance” de la direction Data pour déployer sa gouvernance.

Cette montée en compétence a ainsi permis à l’industriel de s’intéresser au Data Mesh début 2022. Sur la période est toutefois intervenue l’OPA de Veolia – dont la réalisation s’est traduite par des impacts au niveau organisationnel. La phase de réorganisation se poursuit encore, “mais les bases du Data Mesh ont été posées.”

Et dans ce domaine, pas de big bang. Claire Mathieu mène une transformation progressive en inscrivant les nouveaux projets dans l’architecture Data Mesh. “Nous sommes en cours d’industrialisation pour un de nos projets majeurs en intelligence artificielle. Toutes les briques que nous concevons dans ce cadre seront réutilisées pour les prochains projets”, détaille Claire Mathieu.

Le Data Office de Suez a donc conçu une data plateforme dans le cloud, basée sur les technologies Azure de Microsoft – à la manière d’Amadeus, une entreprise pionnière dans l’adoption du Data Mesh at scale. Cette architecture est gérée par la direction Data à l’heure actuelle. Cependant, le run doit être pris en charge par la suite par la DSI, à compter de 2024.

Un premier cas d’usage avec les données IoT des usines de tri

BANNIERE CARRE KYNDRYLLes solutions cloud sélectionnées accueillent un premier cas d’usage exploitant des données IoT et temps réel des usines. La technologie n’est pas la seule évolution par rapport à l’existant. Celle-ci demeure avant tout un enabler.

La véritable rupture concerne l’accessibilité des données IoT sur Azure à des équipes métiers disposant désormais de leurs ressources Data (avec des Data Scientists dans l’effectif de la direction en charge d’une trentaine d’usines de tri mécanique). Avec un pôle important dédié à la performance et à l’amélioration continue, cette direction industrielle faisait un bon candidat pour un MVP Data.

“Les équipes métiers vont pouvoir construire elles-mêmes leurs KPI. Cela n’a jamais été le cas jusqu’à présent. L’approche est exploratoire puisque les métiers n’ont jamais eu accès à ces données, issues en temps réel des machines ou d’algorithmes d’IA.”

Ces nouvelles données pour les opérateurs s’inscrivent dans un projet plus vaste visant à “inventer la nouvelle façon de monitorer notre usine. Les KPI sont donc encore à définir. La participation des métiers permettra directement de construire ces produits Data.”

Auparavant, ces opérations sur les données nécessitaient l’intervention de l’IT, ce qui constitue généralement un goulet d’étranglement dans les organisations. Autre changement : les nouvelles données “sont accessibles aussi bien pour des tableaux de bord temps réel que pour des suivis de performances.”

Cette approche permet une réconciliation des données et des équipes site et siège autour de mêmes indicateurs. “La même source de données sert plusieurs cas d’usage et plusieurs fronts”. L’architecture repose sur une même approche. Sur site, des technologies Edge collectent les données et les enrichissent.

Un deuxième cas d’usage Open Data

La Data est ensuite accessible et manipulable sur le cloud par “certaines équipes métiers”. Ensuite, des front ou applications de type PowerBI consomment ces données et les rendent accessibles à une population plus large. Le fonctionnement Data Mesh et l’agilité qu’il autorise donnent aussi la possibilité aux métiers et au Data Office de déployer rapidement des évolutions fonctionnelles.

“Nous allons intégrer les données cas d’usage par cas d’usage. Mais nous allons surtout faire des liens entre ces cas d’usage. Nous en sommes à notre premier.” Celui-ci est en MVP sur deux premiers sites. Ensuite, Suez envisage de recueillir les remontées terrain avant de passer à l’échelle sur les autres usines, voire même de l’étendre à d’autres catégories d’usines.

“Ce n’est pas pour les mêmes cas d’usage, mais l’architecture, elle, restera identique. Sur la plateforme, nous sommes prêts, notamment à l’ouvrir à d’autres usines et d’autres équipes.” Comme pour le tri, le Data Office a entamé son travail de sensibilisation en convainquant d’autres entités de consacrer des budgets aux recrutements d’experts Data. A noter que l’IT aussi montera en compétences.

“Notre vision Data Mesh s’inscrit sur le long terme. Un deuxième cas d’usage, plus facile, va démarrer”, confie la CDO de Suez. Il a même d’ores et déjà été lancé avec un kickoff le 22 mars. Celui-ci concerne l’open data, des données “nécessaires à beaucoup de collaborateurs pour travailler.”

Des domaines de données à multiplier

Le Data Office prévoit donc de créer une landing zone sur Azure, un Data Product open data “destiné à servir toutes les équipes métiers.” Cela évitera des duplications de mêmes données (topographiques, météo, etc.) pour servir de multiples usages internes.  Ce produit concernera d’abord trois à quatre typologies de données. Un data owner sera également nommé.

La prochaine étape consistera à identifier les jeux de données internes à Suez et susceptibles d’intéresser l’écosystème industriel. Elles seront alors mise à disposition en open data depuis un espace dédié du Data Mesh, anticipe la CDO.

Avant de développer ces usages, Suez  estime nécessaire de se doter au préalable d’un catalogue de données. Ce chantier devrait être mis en œuvre en 2024. Le choix technologique n’est pas encore arrêté. Ce catalogue pourrait aider à accélérer la transition vers des domaines de données et le Data Mesh.

En 2023, Claire Mathieu ambitionne de déployer deux à trois cas d’usage. “Dans les prochaines années, d’ici 4 à 5 ans peut-être, j’aimerais que tous les grands pôles d’activité, coeurs de métier de Suez, disposent de leurs domaines de données.”