Florian Douetteau, Dataiku : « Pour être présent aux Etats-Unis, il faut dès le départ apparaître comme un leader de marché »

La start-up française Dataiku est sous le feu des projecteurs : elle vient de fêter sa première année d’existence en lançant, après 9 mois de bêta-test, son Data Science Studio qui doit faciliter et accélérer les analyses Big Data des entreprises. Lauréate en janvier d’un challenge sur le sujet proposé par le moteur de recherche Yandex, la jeune pousse revient sur ses enjeux du moment, par la voix de son dirigeant et fondateur, Florian Douetteau.

La start-up française Dataiku est sous le feu des projecteurs

Florian Douetteau, fondateur de Dataiku

Votre Data Science Studio se définit comme « un outil intégré pour la construction d’application prédictive ». A qui s’adresse-t-il ?

L’outil est un « enabler », un couteau suisse technologique. Il permet de se connecter rapidement à tout le nouvel écosystème technologique du Big Data qui s’est formé autour de Hadoop, NoSQL, etc. Les entreprises sont de plus en plus amenées à monter de nouvelles infrastructures de données, souvent dans le Cloud, à se connecter à des sources internes comme externes et à la combiner pour fabriquer de la valeur.
Le but de notre outil est donc de permettre aux entreprises de fabriquer leur propre application prédictive rapidement en s’affranchissant des problèmes de nettoyages et de connexions des modèles qui leur prendraient autrement beaucoup de temps. Toutes les organisations qui ont accès à de gros volumes de données, qui veulent les valoriser et les piloter en continu, sont concernées.

 

Avant tout de grandes entreprises, donc ?

Ce n’est pas automatique. Nous avons de nombreux exemples de PME qui doivent gérer des problématiques Big Data. L’un de nos clients, qui travaille dans le domaine de la publicité en ligne, ne compte que 4 salariés, mais par la nature de son activité, il a besoin de manipuler efficacement de tels volumes de données. Plus généralement, les acteurs du web, qui n’ont souvent qu’une centaine d’employés mais des chiffres d’affaires conséquents, ont aussi ces besoins.

D’autres secteurs sont-ils concernés ?

En plus de la publicité, de l’assurance et de l’e-commerce, qui sont des domaines évidents, tous les acteurs qui éditent des contenus et les diffusent sur le web peuvent être intéressés. Le secteur des transports en commun, des opérateurs de réseaux, se pose aussi beaucoup de question d’analyses de données. Il s’agit de mieux gérer le trafic, de comprendre les comportements, d’influer sur la relation avec les usagers. Pour ces acteurs, prévoir et optimiser les moments d’affluence dans les centres névralgiques, est à la fois une problématique de gestion efficace de réseau et de valorisation de leurs emplacements, à des fins marketings.

« TeraLab ouvre le chemin »

Mais qui utilise au final votre Data Science Studio au sein de ces entreprises ?

Le groupe « type » d’utilisateurs mélange des profils business, des analystes métiers, et des profils plus techniques de « Data scientists », avec un ratio moyen de 4 pour 1. Le défi est donc de permettre à ces personnes de travailler efficacement ensemble. Concevoir de nouvelles applications ce n’est pas seulement une histoire de spécifications techniques à implémenter. Il est vital de pouvoir réfléchir avec les métiers et de comprendre quelles analyses seront vraiment pertinentes. Sans compter que notre outil va souvent venir compléter des dispositifs déjà existants dans l’entreprise, géré par les analystes sur la base de modèles traditionnels, ne serait-ce qu’avec Microsoft Excel. Un opérateur télécom par exemple, sait déjà prédire la fraude ou le taux d’attrition, mois après mois à l’aide de règles statistiques… L’enjeu est donc de lui permettre de faire une analyse en continu, avec un degré de détails suffisant pour détecter les fraudeurs en seulement quelques jours cette fois-ci. Cette cohérence avec les pratiques métiers est un challenge supplémentaire, au-delà des aspects technologiques du Big Data, dont il faut tenir compte.

Quel parallèle peut-on établir entre le Data Science Studio de Dataiku et une initiative comme TeraLab, dévoilée en février par l’Institut Mines-Télécom et le GENES* ?

TeraLab part du même constat que nous : les projets innovants nécessite de factoriser plusieurs socles technologiques, certains Open Source, d’autres propriétaires et commerciaux. Nos approches sont donc bien parallèles. Une de leur spécificité est d’offrir – outre les infrastructures Cloud classique – des serveurs à très grands volumes de données, qui permet des applications de R&D très spécifiques. De la même façon, TeraLab propose des environnements de partage de données ultra-sécurisé, qui doivent permettre aux entreprises de pouvoir appliquer sur une plateforme technique adéquate des algorithmes de recherche qu’elles n’auraient pas pu utiliser autrement. J’espère que des initiatives comme celle-ci, en s’attaquant à des problèmes de pointes, vont faire émerger de nouveaux algorithmes qui seront à termes utilisable dans nos métiers. Ils ouvrent le chemin.

En septembre 2013, après un voyage organisé par le pôle Systematic aux Etats-Unis, il était question pour vous d’attaquer ce marché sous 2 ans. Est-ce toujours d’actualité ?

Nous étions cette semaine à la Strata Conf de Santa Clara, où nous avons été sélectionnés parmi les 12 finalistes du concours des start-up innovantes de la Data. C’est une occasion de pitcher et de faire une démonstration de notre produit devant une quarantaine de membres du jury, qui sont en quelques sorts des « pontes de la data ». Même s’il n’y a aucun prix financier à la clef, c’est un excellent moyen de nous faire connaitre rapidement. Nous voulons nous créer de la visibilité aux Etats-Unis car l’écosystème s’avère très différent de celui que nous connaissons en France.
Les réseaux ne sont pas les mêmes et pour être présent là-bas, il faut apparaitre comme un « leader de marché » dès le départ. En fait, c’est un marché où les start-up doivent avoir une vocation de leader international pour s’imposer. En termes de positionnement, ou même de marketing, il faut que nous en tenions compte. Nous devons être un réel acteur de pointe, à travers ce que nous offrons avec nos produits, mais il faut aussi que nous soyons perçus comme tel, avant de franchir le cap.

« L’objectif est clair : devenir un standard »

Comment résumer votre stratégie de croissance 2014 dans cette optique ?

L’important pour nous est maintenant de multiplier la diffusion de notre produit. Nous voulons que de plus en plus d’utilisateurs puissent l’essayer, créer des projets, des usages, de la valeur, et que la communauté des utilisateurs du Data Science Studio grandisse. Dans cette dynamique, je pense que nous aurons quelques-uns de nos clients qui postuleront pour les trophées de l’innovation du congrès Big Data Paris (1er et 2 avril prochain, ndlr). Actuellement, nous sommes une équipe de 12 pour un chiffre d’affaires 2013 de 650 000 euros. Nous voulons le doubler cette année et nous sommes donc dans une logique de recrutement de quelques profils très ciblés, de « data scientists » et de développeurs.

Quel est votre avis sur le travail de constitution d’une filière « Big Data » française, porté par le gouvernement et piloté notamment par Bertrand Diard, le fondateur de Talend ?

Je pense que tout ce qui a vocation à permettre aux start-up françaises de prendre plus de risques, de croître le plus vite possible, de s’internationaliser, va dans le bon sens. C’est vrai au-delà même de la filière Big Data. L’expérience de Talend et de Bertrand Diard est, en ce sens, riche en enseignements. Presque toutes les entreprises françaises qui fonctionnent ont dû aller sur le marché leader des Etats-Unis pour commercialiser leurs produits.
L’objectif est clair : devenir un standard. Nous sommes en effet dans un univers – c’est vrai dans l’informatique et plus particulièrement dans le Big Data – où la prime au leader est extrêmement élevé. Il y a donc un véritable intérêt à prendre des risques et à gagner de la visibilité sur ce marché américain, qui va permettre de décoller. Talend a réussi à le faire alors même que la compétition était très intense.

Au final, quel meilleur souvenir gardez-vous de cette première année d’existence ?

Ce qui m’a le plus marqué, c’est la rapidité d’évolution de notre produit. Il m’est parfois arrivé de littéralement le redécouvrir par le biais de l’une ou l’autre de ses fonctionnalités.
C’est le signe d’une dynamique d’innovation très rapide et enlevée. Pour suivre ce rythme, cette course à l’innovation, il est essentiel d’avoir une vision très claire de ce que l’on veut faire, des ambitions que l’on a pour son outil…
Tout en gardant toujours la souplesse et la créativité qui vont faire qu’une équipe réduite comme la nôtre, va pouvoir aller aussi vite que celles d’entreprises 4 à 5 fois plus importantes.

 *Groupes des Ecoles Nationales d’Economie et de Statistique