Les articles du dossier

Anne-Sophie Taillandier (TeraLab) : « Notre plate-forme permet d’innover plus vite avec les données »

TeraLab est une plate-forme « tiers de confiance » pour la collaboration entre entreprises et chercheurs. Entretien avec Anne-Sophie Taillandier, sa directrice, sur le rôle de cette plate-forme destinée à l’accélération de projets IA, Big Data et IoT, développée au sein de l’Institut Mines-Télécom (IMT).

| Cet article fait partie du dossier « Industrie : l’heure des alliances »

Anne-Sophie Taillandier (TeraLab) : « Notre plate-forme permet d’innover plus vite avec les données »

Anne-Sophie Taillandier (ici à droite lors de l’EBDVF 2017), ingénieure titulaire d’une thèse en Statistiques et réseaux de neurones (ou machine learning) dirige TeraLab depuis plus de deux ans et demi, après être passée chez plusieurs éditeurs de logiciels, dont Dassault Systèmes.

Alliancy. De quels besoins est née la plate-forme TeraLab ?

Anne-Sophie Taillandier. La data pour une entreprise, quelle qu’elle soit, lui impose de s’ouvrir vers un écosystème. Ce qui était moins le cas auparavant ! Pour autant, donner un accès à ses données sur son système d’information (SI) à des partenaires extérieurs, académiques, entreprises innovantes, start-up…, ou autoriser leur analyse par des chercheurs ou autres… reste impossible. Il y avait donc besoin de cet intermédiaire de confiance qu’est TeraLab, c’est-à-dire une plate-forme d’innovation et de recherche sécurisée, souveraine et neutre, sur laquelle nos partenaires peuvent mettre leurs données à disposition. TeraLab est à la fois cette infrastructure, mais aussi un écosystème et un ensemble de services, totalement opérationnels depuis janvier 2014.

Quel est le rôle de l’IMT dans ce consortium qu’est TeraLab ?

Anne-Sophie Taillandier. L’IMT s’est positionné sur un « compartiment industriel ». C’est-à-dire que l’on va plutôt fournir de la sécurité logicielle, que l’on adapte en fonction du besoin de l’industriel [petit ou grand, NDLR] pour mettre à disposition ses données. On lui fournit donc tous les outils techniques et juridiques, toutes les garanties… car nous avons aussi beaucoup de partenaires qui ne savent pas ce qu’ils ont droit de faire de leurs données. Sur TeraLab, ils disposeront ainsi d’un espace de travail totalement isolé des autres espaces de travail des autres projets, et sur lequel nous allons mettre un niveau de sécurité d’accès à ces données qui va dépendre de leurs besoins et permettre un accès uniquement aux acteurs identifiés par le partenaire et nous. Nous devenons ainsi leur tiers de confiance en ce qui concerne la mise à disposition de leurs données.

Et cela va jusqu’où ?

Anne-Sophie Taillandier. Par exemple, on va définir ensemble tout ce qui concerne la propriété intellectuelle, le processus de livraison des données sur l’espace de travail, faut-il prendre une clé USB cryptée, utiliser un disque dur… On va même jusqu’à définir le processus de destruction des données à la fin du projet, qui dure de 3 mois environ si c’est de l’innovation à trois ans si c’est de la recherche. Par défaut, nous ne gardons pas les données à terme, sauf demande particulière de l’industriel qui souhaite poursuivre avec nous. Notre objectif est donc bien d’accélérer toutes les initiatives d’intelligence artificielle et Big Data pour les entreprises en open innovation, recherche partenariale ou collaborative [nationale ou européenne, NDLR] et enseignement. Le data scientist est encore une perle rare, aussi donner l’opportunité aux entreprises de pouvoir interagir avec des data scientists en formation et de les faire travailler sur leurs données réelles et cas d’usage, peut être très intéressant car cela leur permet d’anticiper sur des collaborations futures, voire des embauches…

Au-delà d’offrir ce « bac à sable », comment intervenez-vous ?

Anne-Sophie Taillandier. Au niveau des outils, nous avons une équipe technique sur TeraLab. Aussi, face à des entreprises qui ont une maturité très diverse face au traitement des données, nous pouvons les aider à choisir les architectures, les meilleurs outils pour leur projet… En ce sens, on est neutre, car on ne cherche pas à vendre quoi que ce soit.

Et concernant l’écosystème, de quoi s’agit-il ?

Anne-Sophie Taillandier. On leur donne en effet accès à un écosystème, car on se rend compte que c’est souvent compliqué pour nos partenaires d’accéder aux PME innovantes, aux start-up, aux chercheurs… C’est une vraie problématique ! Et, nous, par notre ADN, nous travaillons beaucoup avec les pôles de compétitivité, les incubateurs au sein de l’IMT… On peut donc générer des rencontres auxquelles ils n’auraient pas pensé. A l’IMT, on compte 1 500 chercheurs environ, 3 500 si on y ajoute les post-docs et les doctorants, dont 200 spécialisés dans la data, que ce soit dans l’analyse mais aussi la mise en conformité, l’anonymisation, la cryptographie ou la traçabilité des données pour pouvoir les traiter.

L’idée est donc d’expérimenter toutes sortes de choses sur TeraLab…

Anne-Sophie Taillandier. Totalement, mais il faut qu’in fine, les entreprises deviennent autonomes sur ces sujets, qu’elles puissent choisir avec une maturité plus grande là où elles veulent aller installer ce type de solutions sur leur système d’information ou sur un cloud externe… La donnée change les frontières des territoires dans les entreprises et cela génère beaucoup de freins, beaucoup de fantasmes que l’on peut voir. Chacun est méfiant de l’utilisation des données que l’autre pourrait en faire… Dès le début, la meilleure solution est d’avoir, autour de la table, quelqu’un qui vient de la DSI, des métiers, de la direction générale autour de la table. Cela facilite grandement les choses. Aussi, chez TeraLab, quand on fait un POC [proof of concept], on mélange ces différentes directions pour disposer du même niveau d’information et qu’ils voient ensemble la valeur créée. Ces expérimentations leur permettent de juger sur du concret.

Où en êtes-vous en termes de projets menés ?

Anne-Sophie Taillandier. Depuis 2014, nous comptabilisons 50 projets industriels (lire encadré) déjà hébergés ou en cours sur la plate-forme, que ce soit dans la logistique, la mobilité, la santé, l’industrie du futur, l’assurance, l’énergie, la culture… Le budget pour TeraLab est de 5,7 millions d’euros pour cinq ans (2014-2018), répartis à égalité entre investissements et fonctionnement. Aujourd’hui, depuis 2016, TeraLab est au point d’équilibre financier et les recettes des projets compensent nos coûts de fonctionnement. Nous allons donc pouvoir pérenniser la plate-forme après 2018, date de fin du PIA qui lui a donné naissance. Surtout, en tant qu’institut de recherche publique, nous ne faisons pas de bénéfice et tout ce que l’on gagne est réinjecté dans les outils afin que nos partenaires puissent utiliser une plate-forme continuellement à l’état de l’art.

Comment intervenez-vous dans l’industrie du futur ?

Anne-Sophie Taillandier. Dans ce secteur, nous avons deux projets européens (Horizon 2020) que nous avons gagné en 2017. L’un d’eux s’intitule Midih (Manufacturing Industry Digital Innovation Hub) et TeraLab, seul partenaire français (sur 25) du consortium, servira d’endroit où l’on peut sécuriser les données. C’est un projet très orienté vers les PME et sur l’innovation. Dès le printemps 2018, notre idée est de lancer des concours d’innovation sur trois thématiques importantes pour les PME (maintenance prédictive, atelier de découpe, interopérabilité logistique…). Cette initiative est très axée cyber-sécurité des objets connectés et gestion de la confiance… Quand on est sur la digitalisation de la chaîne de production, on va avoir de plus en plus de composants qui vont échanger entre eux par divers protocoles, mais derrière il faut sécuriser ces échanges, c’est toute la question du risque industriel… On a de nombreuses thématiques sur ces sujets qui vont de plus en plus se développer. Pour l’instant, les entreprises veulent tout connecter et remonter des données de partout, mais à terme, il va y avoir un retour plus raisonnable sur le véritable intérêt, car tout cela a tout de même un coût… D’ailleurs, une de nos préoccupations également est la formalisation des cas d’usages. Nous voulons vraiment pouvoir aller le plus facilement possible de la preuve de concept [POC] à la preuve de ROI [retour sur investissement, NDLR], c’est-à-dire le plus proche de la valeur. D’où l’idée d’avoir des cas d’usage pertinents.

Auriez-vous des exemples à citer ?

Anne-Sophie Taillandier. Jusqu’à il y a 18 mois environ, on voyait des demandes très verticales qui nous arrivaient, du type « détectez-moi le défaut dans ma chaîne de fabrication » ou « quand dois-je faire réviser ma voiture »… Aujourd’hui, on voit un constructeur automobile par exemple réfléchir à intégrer les données fournisseurs – ou les données garantie – dans sa réflexion pour aller plus loin. En fait, ce sont encore de vrais verrous technologiques ou scientifiques à lever… Mais, en tout cas, le premier verrou à lever est d’arriver à analyser les données d’un produit sur tout son cycle de vie…

Est-ce si difficile ?

Anne-Sophie Taillandier. Ces données sont de sources multiples. Il faut pourtant arriver à ce que tous les acteurs autour d’un même produit mettent à disposition leurs données… D’où la difficulté. C’est pour cela que l’on apporte des garanties de sécurité sur l’accès aux données.

Cette « angoisse » est-elle justifiée ou est-ce un problème culturel ?

Anne-Sophie Taillandier. C’est totalement culturel et cela perdurera tant que la valeur que l’on peut en sortir pour chacun ne sera pas perçue. Notre but avec TeraLab est justement de lever ces verrous, d’accélérer les choses et de voir ce qu’il est vraiment nécessaire de faire. Ensuite, se poseront encore entre eux d’autres problématiques concernant la monétisation d’échanges de données par exemple… Car, une fois le modèle créé, comment va-t-on le monétiser ?

Les grands groupes ont-ils un rôle à jouer dans cette prise de conscience ?

Anne-Sophie Taillandier. Les grands groupes n’ont pas encore compris complètement ce qu’était la notion de coopétition, alors qu’elle est indispensable pour faire sauter les verrous. Ils ont un rôle à jouer dans la maturité technologique de leur écosystème et ils en ont besoin. C’est un point que l’Europe pousse désormais beaucoup dans Horizon 2020 et TeraLab est vraiment là pour les y aider. Les entreprises françaises devraient d’ailleurs aller beaucoup plus voir ce qui se fait à la Commission Européenne, comme le font les Allemands, les Italiens ou les Espagnols. Il y a beaucoup de choses à apprendre, on y trouve des financements, mais surtout, un écosystème qui bouge vraiment.

Quels sont les grands objectifs de TeraLab pour cette année qui débute ?

Anne-Sophie Taillandier. Nous travaillons sur une habilitation de l’Agence des systèmes d’information partagés de santé (Asip) afin de pouvoir héberger des données de santé à caractère personnel et espérons lancer des projets de recherche dans ce domaine, telle la médecine dite « 4P », c’est-à-dire personnalisée, préventive, prédictive et participative. Techniquement, nous avons ce qu’il faut pour recevoir ces données et travailler dessus, mais il faut satisfaire des exigences légales et administratives pour pouvoir le faire, comme respecter la norme ISO 27001.

TeraLab : une forte notoriété européenne

Pilotée par l’Institut Mines-Télécom (IMT) et le groupe des écoles nationales d’économie et statistique (Genes), TeraLab est une plate-forme destinée à accélérer les projets dans le traitement de la donnée par le rapprochement du monde de la recherche et des entreprises. TeraLab a vu le jour en 2014, en réponse à l’appel à projets « Cloud Computing et Big Data » du programme Investissements d’avenir (PIA). Son objectif est de fédérer la demande en logiciels et en infrastructures.

Au-delà d’une mise à disposition d’un ensemble de serveurs (dits « commodity ») et d’une machine « teramemory » (répondant à la consommation d’importantes quantités de mémoire vive) basés à Douai, TeraLab dispose d’une équipe de chercheurs capables d’identifier une demande et d’accompagner des porteurs de projet tout au long de leurs travaux. Les compétences à disposition vont de la configuration d’infrastructure jusqu’au conseil, en passant par l’algorithmique, le machine learning, le deep learning, la data visualisation

TeraLab est, depuis le 1er décembre 2016, labellisée « Silver i-Space », un label décerné par la Big Data Value Association (BDVA), gage de la qualité des services proposés à l’échelle continentale, à la fois sur les plans techniques et juridiques. En Europe, trois autres plates-formes ont obtenu cette labellisation, dont le Sdil en Allemagne.

 

Deux exemples concrets autour de TeraLab

Cas de figures rencontrés par TerraLab dans différents secteurs tels que la santé, la mobilité l’e-commerce, l’éducation, la cybersécurité… Cliquez sur l’image pour l’agrandir @Teralab

1- Data&Musée pour améliorer l’expérience visiteur

Lancé le 27 septembre 2017, Data&Musée est un projet collaboratif mené par la société Orpheo, auquel participent également les écoles Télécom SudParis et Télécom ParisTech. Son objectif : réunir sur TeraLab les données de nombreuses institutions culturelles, afin de développer des outils d’analyses et de prédiction pour les accompagner dans leur évolution.

Leader du projet, le groupe Orpheo, fournisseur de système d’aide à la visite pour les sites culturels et touristiques, est entouré d’entreprises spécialisées dans l’analyse de données, comme Tech4Team, Kernix, MyOrpheo, et de chercheurs. Le Centre des Monuments Nationaux, qui réunit près de 100 monuments, et Paris Musées (14 musées parisiens), se sont positionnés comme terrains d’expérimentations pour le projet.

Aux données déjà collectées individuellement par chaque institution, comme les données de billetterie ou de fréquentation des sites web, s’ajouteront de nouvelles sources collectées par Data&Musée et créées par les visiteurs, grâce à la mise en place d’un livre d’or intelligent (sur lequel travaille la société partenaire GuestViews), à l’analyse des réseaux sociaux et à un système de géolocalisation indoor.

A terme, avec un système d’abonnement ou autre, ces données structurées pourraient être transmises à des institutions non-productrices ou à des tiers (avec l’accord des institutions et des utilisateurs).

2- Quand La Poste lutte contre la fraude

Colissimo, filiale de La Poste, s’est alliée aux chercheurs des écoles de l’Institut Mines-Télécom pour lutter contre la fraude. Sur dix-huit mois (entre janvier 2014 et juin 2015), ce sont des dizaines de milliers d’euros qui ont été versés en indemnisation, pour des dossiers identifiés comme suspects de fraude par l’entreprise. D’où l’intérêt de collaborer, dès fin 2015, avec TeraLab autour de la détection des fraudes à l’indemnisation par fausse déclaration de dépôt des colis. Dans un premier temps, le rôle de TeraLab a consisté à reproduire la même classification des fraudes à partir du modèle algorithmique développé. Une fois le modèle opérationnel pour les chercheurs et validé par les experts de La Poste, reste encore à l’industrialiser…