Henri Verdier « Les données sont un bien commun essentiel »

Henri VerdierChargé du pilotage de l’open data en France, Henri Verdier, spécialiste du big data et de la transformation numérique, estime qu’une troisième révolution numérique est en marche, celle de la donnée. Tout juste nommé chief data offi cer (CDO) du gouvernement (ou administrateur général des données), le directeur de la mission Etalab est placé sous l’autorité du Premier ministre et rattaché au secrétaire général pour la modernisation de l’action publique (SGMAP). La France devient ainsi le premier pays à avoir un CDO au service de son gouvernement.

Propos recueillis par Isabelle Repiton, avec Catherine Moal

Alliancy, le mag. Vous venez d’être nommé administrateur général des données. Quelle est votre mission ?

Henri Verdier. Elle vise la mise en culture et l’exploitation des données. C’est-à-dire s’assurer que l’on dispose des bonnes données, que ceux qui en ont besoin les connaissent et que les décisions soient fondées sur des informations pertinentes. Cela semble basique, mais on ne dispose pas toujours des bonnes données au moment de prendre une décision.

Comment cette fonction est-elle née ?

Cette fonction est née dans des entreprises, puis dans de grandes villes américaines. 90 % des chief data officer dans le monde sont des Américains. Il en existe quelques-uns en Grande-Bretagne, et ils sont rares en France (par exemple, chez Ogilvy). La France devient ainsi le premier pays à avoir un CDO au service de son gouvernement. C’est une fonction interne à l’Etat, complémentaire de la mission d’ouverture des données publiques qui, elle, consiste à les mettre à la disposition du grand public. Cette mission-là ne concerne pour l’instant ni l’amélioration de la qualité de la donnée, ni sa circulation entre les administrations. Le CDO peut conduire des expérimentations sur l’utilisation des données pour renforcer l’efficacité des politiques publiques.

Quels sont les objectifs de l’open data ? Où en est la France ?

Il y a au moins trois objectifs. D’abord, une démo- cratie plus aboutie : le citoyen a le droit de savoir… L’open data doit aussi contribuer à l’innovation et à la croissance, et améliorer l’efficacité de l’action publique. Il résulte d’un double mouvement. Celui d’aller vers plus de transparence, qui ne date pas d’hier. Les rapports de la Cour des comptes sont publics depuis 1850, et la loi Cada*, qui reconnaît le droit d’accès aux documents administratifs, a presque 40 ans.

L’open data est ce mouvement de transparence, plongé dans Internet : un monde de développement agile, de coproduction avec les citoyens, de crowdsourcing, d’économie de plate-forme. La Californie est encore l’épicentre, mais la France a aussi un grand écosystème numérique, en termes d’inventivité et d’énergie d’entrepreneuriat numérique, dans un peloton qui comprend Israël, la Corée, le Royaume-Uni… L’open data prend donc de l’ampleur dans un pays qui a la double culture de la redevabilité de l’action publique et du numérique. Dans l’e-governement survey de l’ONU, qui englobe l’open data, mais aussi la e-administration, la France est classée quatrième dans le monde et première en Europe, et vient, de ce fait, d’être honorée par l’ONU le 6 octobre dernier.

Comment mesure-t-on la performance en la matière ? En nombre de jeux de don- nées ouvertes ?

Pas seulement. L’open data est aussi un travail sur les formats, et un travail au service de l’engagement des citoyens. En nombre de jeux, les comparaisons sont difficiles. Par exemple, on entend souvent que la France n’ouvre pas assez ses données de santé. En fait, elle en ouvre à peu près autant que les autres, mais elle en a beaucoup plus. Nous sommes les seuls dans le monde à avoir une base de données de toutes les ordonnances remboursées…

Ensuite, il y a des différences de sensibilité. Les Etats-Unis, la Grande-Bretagne exigent une trans- parence plus fine en termes de dépense publique. En Norvège, on peut demander à lire la correspondance d’un ministre, et connaître ses dépenses à l’euro près. Ces pays se sont focalisés sur le contrôle de l’Etat, la transparence de la vie publique. La France, elle, travaille sur les données ressources pour l’innovation. Tous les pays n’ont pas un Institut géographique national (IGN) ou un opérateur de prévisions météorologiques (Météo France) fournissant des données gratuites. On partage aussi beaucoup de données environnementales sur la qualité de l’eau…

L’open data peut être vu soit comme un contre-pouvoir, soit comme une ressource pour les citoyens, la société et l’économie. C’est plutôt la vision française. Sur le portail data.gouv.fr, presque tous les ministères proposent des données : accidents de la route, pollution, transports, cartographie, sociologie, population carcérale, météo, marées… En termes de diversité des thèmes traités, nous sommes sans doute un très grand pays de l’open data.

Qui dépose des données sur data.gouv.fr ?Parcours Henri Verdier

Depuis 2013, tout le monde peut y déposer un jeu de données, à condition de s’identifier. 336 organisations différentes le font, dont deux tiers ne sont pas des organismes publics. Les données doivent être sourcées, factuelles. La fiabilité est contrôlée a posteriori par Etalab et par la communauté, à la façon de Wikipédia. L’information d’autorité fournie par des services de l’Etat est distinguée, les autres n’engagent pas l’Etat. C’est un changement de philosophie de l’open data : nous sommes passés d’une vitrine pour satisfaire à la demande de transparence à l’idée que les données sont un bien commun essentiel, et qui doit être coproduit et co-utilisé. On compte déjà plus de 1 300 réutilisations, venant de toute la société civile et de personnes qui utilisent les données publiques pour produire du sens.

Les données doivent-elles être gratuites ?

On peut séparer deux raisonnements. De manière générale, les données ne prennent de la valeur que si les gens s’en servent. Un prix prohibitif freine leur utilisation. Des entreprises commencent à apprendre à travailler avec des stratégies d’open data permettant des alliances avec leur client-contributeur. Laisser gratuite la donnée brute peut également servir à se focaliser sur des services à valeur ajoutée. L’Etat peut parfois appliquer ces raisonnements, mais il en applique aussi un autre. Il doit reconnaître le droit du citoyen à accéder gratuitement et à réutiliser librement les données produites par son administration à l’occasion de ses missions de service public.

Est-il légitime que les données publiques gratuites soient réutilisées par des services commerciaux et des acteurs privés pour leurs profits ?

Les données font partie des externalités économiques que l’Etat fabrique depuis toujours, comme les routes, l’éducation… Combien d’accidents de la route ? Le niveau en maths progresse-t-il ? Quelle est la population carcérale ? L’Etat a le devoir de le savoir et de le partager. Ensuite, si on veut des informations particulières, c’est différent. C’est un service rendu que l’on est en droit de facturer. Il est important de considérer ces externalités, car des pans entiers de l’économie seront fondés sur la donnée. De plus en plus, des capteurs produisent des données, et tout est connecté. On est en train de « data-ifier » le monde tout en mettant le citoyen au centre du jeu. Quand on en arrivera aux données qui sont les infrastructures critiques de la modernité, à des flux massifs de données temps réel décrivant des morceaux entiers du réel – la consommation des compteurs électriques, la circulation des trains… –, on pourra réfléchir aux différentes stratégies de gratuité.

Il y a donc plusieurs types d’ouverture des données…

On peut ouvrir en laissant les gens s’approprier les données. On peut ouvrir en laissant les gens interroger une base de données que l’on conserve. Si, demain, les données des compteurs électriques intelligents constituent une grosse infrastructure de données sur l’énergie, qui commande une filière industrielle entière, on peut l’ouvrir à la consultation, tout en la gardant chez EDF. C’est ce que fait Facebook : vous pouvez faire des requêtes, utiliser son Open Graph Protocol, mais pas l’aspirer. Facebook reste au centre du jeu. C’est une stratégie de plate-forme. Le réseau GPS est un autre exemple. Beaucoup d’entreprises développent des services utilisant les coordonnées GPS, mais les Américains gardent le contrôle de l’infrastructure satellite. C’est la différence entre open data et open API (application programming interface).

On peut aussi travailler les conditions de licence (dites share alike) qui autorisent des utilisations aux acteurs, qui partagent gratuitement le fruit de leur traitement des données. Pour les données qui n’entrent pas dans le cadre du droit des documents administratifs, il existe donc toute une gamme de stratégies d’ouverture… Par ailleurs, si on libère des ressources pour l’innovation, il est préférable d’avoir des entreprises innovantes. L’open data donnera la totalité de son impact économique, si on a une politique industrielle qui va avec. C’est la direction qu’a ouvert le plan industriel sur le big data.

Quels seront les prochains chantiers ?

Il y a trois sujets qui se recoupent partiellement : l’open data, l’open government et le big data. L’open data est devenu facile, avec le nouveau portail data. gouv.fr. Une communauté est en train de naître et de se développer.

Sur l’open government, un chantier s’ouvre dans le dialogue avec la société civile, pour connaître ses aspirations, les progrès qu’elle attend. La consultation sur la future loi numérique, lancée le 18 septembre, en donnera l’occasion. C’est aussi un sujet de relations internationales. La France est au comité directeur de l’Open Government Partnership, où siègent pour moitié des gouvernements, pour moitié des représentants de la société civile, des ONG. La France a ses valeurs à promouvoir.

Le big data enfin, doit permettre à terme de définir des stratégies d’action, de pilotage serré en temps réel par la donnée. Quand votre véhicule vous alerte en temps réel que vous êtes en excès de vitesse, vous changez votre comportement. Cela peut s’appliquer à d’autres domaines. On pourra améliorer l’efficacité et les comportements quand on sera capable de piloter l’action publique à partir de la donnée en internalisant les méthodes des data sciences. Cela se fait déjà à Bercy, dans la recherche de la fraude fiscale. Les services statistiques de certains ministères utilisent aussi le big data, par exemple sur la prévention routière. Mais ce n’est pas encore un réflexe, une méthode systématique, généralisée.

* La loi Cada

La loi n°78-753 du 17 juillet 1978 reconnaît à toute personne le droit d’obtenir communication des documents détenus dans le cadre de sa mission de service public par une administration, quels que soient leur forme ou leur support. Elle crée une Commission d’accès aux documents administratifs (la Cada) pour assurer la bonne application du droit d’accès.

 

Pour aller plus loin, découvrez notre Centre de Ressources big data.

Centre de ressources Big Data alliancy, le mag