Depuis longtemps, l’Institut national de la statistique et des études économiques fait largement appel à l’open source pour construire son système d’information, notamment pour ses applications métiers. Au-delà de son SI, l’institution travaille sur des communs numériques.
À l’Insee, réduire les dépendances vis-à-vis des fournisseurs est une évidence depuis des années. « J’ai toujours eu une forte sensibilité à la question de la souveraineté », souligne Jean-Séverin Lair, son DSI. « Une position avec laquelle je me sentais un peu seul il y a seulement cinq années. Ce n’est plus le cas aujourd’hui. » Direction générale du ministère de l’Économie et des Finances, l’Insee compte 5 000 agents, dont 430 pour la DSI. Un pourcentage élevé lié à ses métiers. Les fonctions RH et comptables sont prises en charge par le SIRH interministériel RenoiRH (l’outil interministériel de gestion des ressources humaines) et par Chorus. Son SI comprend autour de 200 applications chargées de répondre à ses besoins métiers.
Elles prennent en charge la collecte et le traitement de données administratives comme la déclaration sociale nominative (DSN), la gestion de grands répertoires comme Sirene, le RNIPP (Répertoire national d’identification des personnes physiques), le recensement de la population, le recueil des données par Internet, par téléphone ou par contact direct avec des enquêteurs, ainsi que la fabrication d’indicateurs de conjoncture comme la croissance du PIB ou les indicateurs de démographie. La quasi-totalité de ces applications ont été développées en interne et sont basées sur de l’open source. Historiquement, pour répondre à ses besoins d’analyses statistiques, l’institution utilisait les outils de SAS. « Depuis plusieurs années, nous avons développé nos propres outils avec le langage R, un langage de programmation libre dédié aux statistiques. Ce qui nous apporte une maîtrise complète des outils. Nous n’aurons plus de logiciels SAS fin 2025 », précise le DSI, qui ajoute : « Ces développements lourds ont été menés en interne. Ils ont représenté pas moins de 80 ETP. » Dans la même logique d’indépendance, d’économies et de maîtrise, Oracle a été totalement remplacé par PostgreSQL.
Des projets utilisés dans d’autres pays
Le recours à l’open source ne se limite pas à ces substitutions. « Nous avons développé Onyxia, une souche logicielle libre permettant de créer un environnement cloud de déploiement d’outils utiles aux data scientists », décrit Jean-Séverin Lair. Cette plateforme open source a été choisie par la Norvège pour constituer son infrastructure dédiée à ces métiers. L’Europe l’utilise également et l’ONU s’y intéresse.
Outre ce cas, « nous contribuons beaucoup à des projets open source, pas à titre institutionnel, mais des collaborateurs de l’institution travaillent régulièrement sur ces sujets », souligne Jean-Séverin Lair. Une démarche volontariste, couplée à une attention soutenue sur le sujet de la sécurité. « Comme l’a illustré la faille Log4J, la chaîne d’approvisionnement logicielle est un point de plus en plus sensible, confirme le DSI. Il ne s’agit pas d’utiliser n’importe quelle bibliothèque, même attractive. Nous contrôlons beaucoup plus qu’avant tous les composants. »
Vers des applications conteneurisées
Côté Microsoft, si la bureautique repose sur LibreOffice et l’intranet sur le logiciel de Jalios, l’annuaire et les postes clients sont toujours sous Windows. « Une partie des utilisateurs ne sont pas encore prêts à utiliser Linux sur les postes clients. Même des changements simples posent la question de l’accompagnement », constate le DSI. Évolution prévue, la « maturation » d’un poste client Linux est en cours. Il sera destiné aux 430 agents de la DSI et également à une partie des statisticiens. Autre brique propriétaire, VMware est toujours en production. « La virtualisation et les VM sont pour nous des technologies dépassées, avance Jean-Séverin Lair. Nous travaillons beaucoup sur le développement d’applications conteneurisées. Nous allons continuer à utiliser les VM, et donc VMware, mais sur de moins en moins d’applications. »
Côté commercial, « les prix publics très onéreux sont négociés. Mais si on réduit la voilure, les réductions s’évaporent et on se retrouve à payer le même prix. La seule façon de réduire la note avec cet éditeur, comme avec quelques autres, est d’en sortir complètement », décrit le DSI.
Des données très protégées
Le recours au cloud n’est pas une option : la réglementation fixe un classement des données en fonction de leur sensibilité. Les conditions d’usage sont plus ou moins strictes. Certaines données transitent de façon chiffrée, indépendamment de la sécurisation du transport ; certaines le sont nécessairement au moment de leur stockage. « Globalement, hormis le cas de l’open data, les données à l’Insee sont soumises à des conditions strictes d’hébergement et d’accès. Des applications maison prennent en charge ces opérations », résume Jean-Séverin Lair.
Côté cloud, « nous attendons beaucoup que le cloud de la DGFiP supporte la conteneurisation pour pouvoir vraiment y investir », insiste le DSI. Dernier sujet, l’Insee mène des expérimentations concernant les infrastructures nécessaires à l’IA générative. « Il serait intéressant d’avoir une solution mutualisée au niveau de l’État sur ce sujet, avance Jean-Séverin Lair. Le réseau interministériel de l’État est une réussite, une infrastructure mutualisée que les ministères individuellement n’auraient pu mettre en place ; on pourrait en prendre exemple pour des moyens communs d’IA », conclut-il.
