Le cloud, levier indispensable d’une stratégie Data ?

Dans le cadre de leur stratégie d’industrialisation de la Data et de l’IA, des grandes entreprises prennent un virage affirmé vers le cloud, à l’image d’Adeo, LVMH ou La Redoute. Mais attention à maîtriser les coûts.

Cloud levier data En juin, le géant du luxe LVMH officialisait un partenariat stratégique avec Google Cloud. Celui-ci est notamment motivé par la volonté de développer de nouvelles solutions d’intelligence artificielle. Un an plus tôt, c’est Renault qui se rapprochait de Google. Là aussi, c’est le thème de la Data et de l’IA qui motivait la politique de l’industriel français.

Une autre grande entreprise française, l’opérateur Orange, s’alliait à la firme californienne à cette même fin. L’industrialisation de ces projets stratégiques passe-t-elle désormais inévitablement par des accords avec les grands fournisseurs de cloud public ? Pas nécessairement, mais de grandes organisations ont néanmoins déjà migré dans le cloud pour accélérer leur transformation Data. C’est le cas par exemple d’Adeo (Leroy Merlin, Bricoman…).

Le cloud, facteur d’accélération « incroyable »

Mais avant de migrer ses données, le groupe a cependant effectuer un travail de conformité pour identifier les données éligibles au cloud. Adeo a même développé un outil de « compliance temps réel » pour suivre la conformité et automatiser des actions. Sont ainsi rapidement bloqués les transferts hors de la zone Europe.

Le passage au cloud est donc contrôlé, mais se révèle cependant indispensable pour l’entreprise pour industrialiser et passer à l’échelle. « Le cloud est un facteur d’accélération incroyable. Nous l’avons constaté durant le premier confinement. Si nous n’avions pas fait ce mouvement dans le cloud, nous n’aurions pas passé la crise de la même façon », souligne lors d’un webinar SFEIR son chief data officer, Laurent Ostiz.

Le confinement n’a pas été simultané dans l’ensemble des marchés où est implanté le distributeur. Grâce à un data hub global dans le cloud, les filiales ont pu accéder facilement aux données des pays déjà en confinement pour analyser les évolutions de comportement des consommateurs et ainsi les anticiper.

« Le cloud est reconnu au sein du groupe comme étant un facteur différenciant. Nous ne ferons plus machine arrière », déclare le CDO. Chez Dailymotion, la tendance est plus à une hybridation des infrastructures. Le spécialiste du streaming, créé avant l’émergence du cloud, dispose de trois datacenters dans le monde.

Pas de Data dans le cloud sans démarche FinOps

Pour autant, Dailymotion exploite divers services cloud, dont BigQuery depuis 2014. L’entrepôt de données s’est progressivement enrichi de nouvelles données. En 2017, à l’occasion d’une refonte de l’équipe Data, s’est développé en outre le recours à des services managés (Dataflow, Kubernetes…).

Désormais, toute la partie « analytics » réside dans le cloud. Pour les outils de Data Science, le basculement intégral vers le cloud est en cours chez Dailymotion. La raison est simple : tester rapidement pour évaluer la pertinence d’un développement. Mais tous les projets ne restent pas en production dans le cloud ensuite.

Un lancement dans le cloud permet toutefois de définir le coût et donc de réaliser un arbitrage ultérieur. « S’il n’y a pas d’élasticité ou si les SLA sont modérés, il peut y avoir un bénéfice à acheter nous-mêmes des GPU ou du stockage pour faire tourner le projet on-premise », précise Philippe Girolami, responsable de l’ingénierie Data chez Dailymotion.

Le moteur de recommandation du site de streaming a ainsi été lancé initialement dans le cloud, avant d’être finalement rapatrié dans un datacenter en propre. L’expert insiste sur la nécessité d’adopter une démarche FinOps pour suivre avec précision le coût des services cloud consommés. Depuis plus d’un an, tout (jeux de données, workflow…) est à cette fin labélisé pour calculer la facture de chacun des produits.

De l’hybride pour les coûts et les produits critiques

Cette approche FinOps est d’autant plus nécessaire que dans le domaine de la Data, la consommation ne fait que croître, comme le rappelle Philippe Girolami. « On ingère de la données tous les jours. De nouveaux modèles et jeux de données sont ajoutés. Les coûts augmentent en permanence. C’est consubstantielle à la Data. »

Pour maîtriser ces coûts, il convient donc de s’interroger par exemple sur les politiques de rétention des données. L’objectif est d’optimiser en permanence l’utilisation faite des ressources dans le cloud. Au FinOps s’ajoute donc un volet de gouvernance de la Data.

A La Redoute, « full cloud » pour les produits Data, ces problématiques sont également prises en compte. Dès l’origine, la direction Data, indépendante de la DSI, faisait en effet le choix de démarrer dans les environnements cloud (Google et Azure). 60% des données exploitées proviennent néanmoins de l’IT et sont donc transférées dans le cloud. La mise en production des projets s’effectue également dans le cloud, principalement Google. De l’hybridation existe cependant.

« Les dispositifs très critiques repartent à l’IT, qui dispose de suffisamment de ressources pour faire de l’Ops de très haute disponibilité. Nous avons une jauge. Lorsque les SLA approchent les 100% et que l’impact sur les ventes peut être immédiat, nous confions les opérations à la DSI grâce à des technologies de conteneurisation comme Kubernetes et Docker », confiait à Alliancy le chief data Officer, Samir Amellal.