Raphael Viard (SNCF) « Notre objectif n’est pas d’aller vers le 100% cloud public, mais de privilégier un modèle hybride. »

Alors que le groupe SNCF mène une ambitieuse stratégie de transformation numérique, Raphael Viard, Chief Transformation Officer & Chief Technology Officer, doit moderniser le socle numérique qui porte cette stratégie. Un véritable défi lorsqu’il faut jongler entre cloud, IoT, big data et applications legacy.

> Cette interview est extraite du carnet « DSI Stratèges et Infrastructures » : téléchargez-le ici pour lire l’intégralité des contenus.

Raphael Viard, « Notre objectif n’est pas d’aller vers le 100% cloud public, mais de privilégier un modèle hybride. »

Raphael Viard, CTO, groupe SNCF

Qu’est-ce qui vous a poussé à lancer un vaste programme de modernisation du socle numérique du groupe SNCF ?

Raphael Viard. Lorsque nous avons commencé à nous intéresser à l’IoT et au big data, tout comme pour les applications mobiles, nous avons rapidement compris que notre système d’information ne serait pas assez agile pour aborder ces nouvelles technologies. Nous avons mené de nombreux proofs of concept (PoC) qui fonctionnaient bien, mais dès qu’il fallait réinjecter de nouvelles données dans nos processus métier, c’était plus problématique.

Illustration de ces freins liés à notre existant, nous savons créer des applications mobiles très performantes sur de nouvelles technologies, des applications capables de faire face à de très fortes charges. Mais face à ces applications, notre back office n’était pas capable de répondre au flux de demandes, ce qui nous posait un véritable problème en termes d’agilité.

Le programme que nous avons mis en place vise à transformer notre socle technologique afin d’accélérer la transformation numérique de nos métiers, disposer à la fois d’un socle agile et à l’état de l’art technologiquement.

Quels sont les principaux axes de cette transformation ?

Raphael Viard. Il est possible de résumer cette transformation en cinq piliers. Il s’agit, d’une part, de pouvoir délivrer un environnement de travail adapté à nos collaborateurs afin de leur apporter bien plus de souplesse au quotidien. Le deuxième point consiste en une adoption significative du cloud public allant de pair avec une automatisation des tâches liées aux data centers. Nous avons besoin d’être une entreprise étendue qui doit pouvoir travailler avec des start-up et des prestataires externes. Nous avons besoin de haut débit depuis le poste de travail au sens large jusqu’à nos data centers software-defined.

Le troisième point est plus transverse : il s’agit de doter le groupe de plateformes digitales mutualisées. Nous avons ainsi mis en place, à ce jour, trois plateformes de ce type, l’une pour l’IoT, une deuxième pour le big data et une troisième dédiée à notre portefeuille d’API et à l’exposition de nos données. Le quatrième pan de notre stratégie porte sur ce que l’on appelle la cybersécurité « by design ». Cela consiste à intégrer des outils de sécurité dans nos chaînes d’intégration continue afin d’analyser le code produit par les équipes DevOps. Ces outils doivent nous aider à éviter les vulnérabilités. Enfin, le dernier et 5e point concerne l’hébergement de la data. Pour ce volet, nous répondons par des capacités d’hébergement dans le cloud public tant pour notre plateforme big data qu’IoT, ainsi qu’en « APIsant » notre système d’information.

« En termes de gouvernance de la donnée, nous avons plusieurs niveaux de classification. Une donnée au niveau de classification le plus élevé n’est pas éligible au cloud public. »

Aller vers un SI 100% porté par le cloud public, est-ce un objectif atteignable pour une entreprise de la taille du groupe SNCF ?

Raphael Viard. Notre objectif n’est pas d’aller vers le 100% cloud public, mais de privilégier un modèle hybride. Il faut bien distinguer l’objectif de ce qu’il est possible d’être fait. Nous allons vers le cloud public pour les applications qui sont à la fois techniquement éligibles au cloud et qui peuvent aussi tirer bénéfice du cloud, notamment en termes d’élasticité. Pour d’autres applications, c’est parfois trop compliqué soit pour des contraintes de sécurité, de temps réel, soit parce qu’il s’agit de systèmes qui ne sont pas éligibles. Une partie du patrimoine IT sera de toute manière préservée en interne et nous visons aujourd’hui un ratio 60/40, avec 60% d’applications qui iront dans le cloud public et 40% qui resteront dans nos data centers internes, tout en sachant que dans ces data centers internes, nous aurons deux grandes parties. Une partie pourrait être assimilée à ce que certains appellent du cloud privé, même si c’est un terme que je n’aime pas car on n’aura jamais élasticité et paiement à la consommation dans un data center privé. Néanmoins, nous cherchons à automatiser au maximum ce qui peut l’être dans l’exploitation de nos data centers, et préserver une partie de ce patrimoine qui correspond aux applications pour lesquelles cela ne fait pas sens de réécrire le code et qui ne sont ni éligibles à la virtualisation, ni au cloud public.

Quelles règles de gouvernance avez-vous établi afin de décider si une donnée peut aller ou non sur le cloud public ?

Raphael Viard. En termes de gouvernance de la donnée, nous avons plusieurs niveaux de classification, et pour résumer, une donnée qui est au niveau de classification le plus élevé n’est pas éligible au cloud public. Classifier la donnée est un exercice complexe car nous manipulons des masses de données au quotidien. D’ailleurs, nous menons plusieurs politiques de front vis-à-vis de ces données. Nous menons une stratégie open data depuis plusieurs années, ce qui explique qu’une partie de nos données sont publiques et à l’autre extrémité, nous gérons des données confidentielles que nous gardons en interne. Entre les deux, nous avons beaucoup de données qui sont chiffrées sur nos messageries, sur nos postes de travail, avec une large palette de moyens de protection de nos données.

Par ailleurs, nous sommes bien évidemment très attentifs aux réglementations relatives aux données qui s’appliquent à nous. La plus connue est le RGPD, mais nous sommes soumis à bien d’autres.

Quelles sont, selon vous, les applications où le cloud public est incontestablement plus adapté que l’approche on premise classique ?

Raphael Viard. Pour une application mobile, par exemple, qui doit faire face à de très fortes charges comme les connaît fréquemment l’application SNCF aujourd’hui, il est bien plus simple de faire tourner son back-end dans le cloud public afin de bénéficier de son élasticité. Sur l’IoT, l’approche a été un peu différente. C’est un domaine où finalement il est assez rapide de mettre en place des PoC. On arrive à démontrer des gains assez rapidement et à trouver des pistes d’optimisation, mais aller au-delà de ces démonstrateurs implique de modifier les processus business et la mise en œuvre de ces optimisations demande beaucoup plus de temps au quotidien.

Le cloud est excessivement important car il permet de commencer petit mais de penser grand. Si nos métiers ont besoin de mener un PoC sur de l’IoT, le ticket d’entrée doit être faible et, sur ce plan, le paiement à l’usage est primordial. D’un autre côté, il ne faut pas mener un PoC sur une technologie et devoir en changer lorsqu’on veut aller vers le « run ». Il est important que l’on puisse monter des prototypes puis passer en production sur une même plateforme et, sur ce plan, le cloud est parfait pour ça !

Via l’IoT, le groupe SNCF collecte de plus en plus de données dans son exploitation des trains. Comment ces données viennent-elles enrichir votre stratégie data ?

Raphael Viard. C’est dans notre data lake hébergé sur Microsoft Azure où nous consolidons toutes ces informations et réalisons nos analyses. Selon moi, l’IoT est avant tout une problématique d’acquisition de données. Tout le volet analytique, intelligence artificielle est plutôt du ressort de notre plateforme big data. L’IoT est pour nous une source d’enrichissement de données dont nous disposions déjà en partie. Nous recueillons des informations qui proviennent des trains depuis longtemps, pas nécessairement sous la forme d’IoT. Un train est un système communicant qui remonte des alertes que nous analysions. La pose de capteurs supplémentaires va nous fournir des informations complémentaires.

> Cette interview est extraite du carnet « DSI Stratèges et Infrastructures » : téléchargez-le ici.

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu

Raphael Viard (SNCF) « Notre objectif n’est pas d’aller vers le 100% cloud public, mais de privilégier un modèle hybride. »

Suggestion de contenus