Big Data : ne cherchez pas que des Data Scientists

Luc Legardeur, président de Xebia © Xebia

Ils sont portés au pinacle par l’ensemble de l’économie numérique pour leurs connaissances si rares à trouver. Ils ont des parcours académiques exceptionnels qui leur permettent de prétendre à des salaires mirobolants. Ils trouvent des corrélations là où d’autres n’y voient qu’une suite de nombres abscons et insipides. Ce sont les Data Scientists et tout le monde se les arrache.

À en croire le cercle encore très fermé des Chief Data Officer et Digital Officer, ces super héros des projets Big Data sont indispensables à la réussite de ces nouveaux types de projets informatiques. Oui certes, ils sont importants pour transformer en monnaie sonnante et trébuchante ces gisements de données, mais ce ne sont pas les seuls.

En effet, mener avec succès une initiative Big Data porteuse de valeur par l’innovation est une affaire de pluridisciplinarité des compétences, de mise en place d’un dispositif idoine et d’un travail d’équipe où les uns ne sont pas plus importants que les autres.

C’est tout d’abord une question de méthode.

Procéder par cycles itératifs et incrémentaux

La créativité est une affaire d’empirisme. L’organisation projet idéale pour tirer pleinement partie d’un projet Big Data, s’appuie sur des hypothèses destinées à être sans cesse remises en causes, confrontées à la réalité du terrain par des feedbacks nombreux, des prototypes qui seront jetables et des cycles de livraison courts. Cette approche, les anglo-saxons l’ont baptisée « Lean Startup ». Elle permet d’avancer à petit pas, d’expérimenter en se trompant, d’apprendre à faire et défaire jusqu’à parvenir à une solution économiquement viable, techniquement réalisable et répondant à un besoin au ROI identifié.

Beaucoup d’entreprises se jettent à corps perdu dans les projets Big Data avec des paradigmes de conduite de projets désuets et parfaitement inadaptés au monde mouvant des projets numériques de demain. La réussite passe par la remise en cause des méthodes traditionnelles et l’acceptation de travailler en mode « Startup ».

Un regroupement de profils hétéroclites

La deuxième recette du succès des projets Big Data réside dans la complémentarité des compétences nécessaires à leur réalisation.

Voici, le dispositif minimal à mettre en place pour exploiter pleinement le gisement des données de votre entreprise :

Commençons par le métier puisqu’il est, en général, le commanditaire des travaux.

Il devra déléguer à ce que certains appellent un Product Owner ou bien un Business Analyst en charge d’apporter la vision du produit dont l’équipe a la charge. Orienté résultats, il sera le garant de KPIs qui attesteront de la valeur apportée par le projet.

Il sera la hotline fonctionnelle de l’équipe technique, capable de prioriser les fonctionnalités attendues selon leur importance, de spécifier à la volée un besoin et de concevoir des tests d’acceptance pour les équipes techniques.

Ce mouton à 5 pattes est tout aussi important que le Data Scientist et aussi difficile à dénicher sur le marché.

Viennent ensuite les Data Engineers et Data Architects qui ont les compétences techniques nécessaires à l’extraction et à la collecte des données, à la conception d’un système impliquant des briques technologiques complexes et au développement logiciel.

Les concepts et les technologies impliqués sont si nouveaux que là aussi, il y a une très forte pénurie sur le marché. Il faudra probablement plusieurs années avant que nos écoles d’ingénieurs ou universités soient aptes à nous délivrer les contingents nécessaires à garder notre pays dans la course mondiale de la Data.

Il faut également un administrateur de la solution mise en place, garant de la disponibilité, de la performance du système lorsque celui-ci devient critique et de sa sécurité, tant les données manipulées peuvent parfois être sensibles.

Là aussi, il est très difficile de trouver des personnes compétentes car les premières mises en place de ces solutions en France n’ont pas plus de 5 ans.

Enfin, bien entendu, le Data Scientist a son rôle à jouer. Il est en charge de concevoir des algorithmes de programmation pour l’analyse des données. Statisticien dans l’âme, il est capable d’élaborer des hypothèses en interprétant des séries de chiffres sans signification pour le pékin lambda et de concevoir des algorithmes auto apprenants (le Machine Learning). Il est clef dans le dispositif.

Il ne l’est pour autant ni plus ni moins que les autres comme nous avons tenté de vous le démontrer.

Comme le disait Alexandre de Saint-Exupéry « La pierre n’a point d’espoir d’être autre chose qu’une pierre. Mais, de collaborer, elle s’assemble et devient temple. »

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu

Big Data : ne cherchez pas que des Data Scientists

Suggestion de contenus