IAG : Docaposte tente le pari de la souveraineté| Alliancy

Docaposte souhaite renforcer son positionnement en tant que tiers de confiance numérique. Comment ? En proposant sa première offre d’IAG (Intelligence Artificielle Générative) destinée aux professionnels de la santé et à ceux du secteur public. Une solution développée en collaboration avec LightOn, Aleia et NumSpot. Pour Guillaume Leboucher, coordinateur du pôle Data/IA de cette filiale de La Poste, l’enjeu est de taille : démontrer l’émergence de solutions françaises performantes et fiables.

Guillaume Leboucher coordinateur du pôle Data IA de cette filiale de La Poste

Chez Docaposte, quel sens donnez-vous au concept de souveraineté appliqué à l’Intelligence artificielle générative (IAG) ?

Docaposte se positionne comme un tiers de confiance numérique. Nous avons réussi à générer cette confiance dans nos métiers antérieurs, à savoir la gestion du vote, de l’archivage et de la signature électronique. Nous garantissons à nos utilisateurs que leurs données sont toujours accessibles et sécurisées. Une fois ce cadre posé, je pense que la souveraineté s’applique à tout ce qui n’est pas « Cloud Act », c’est-à-dire tout ce qui ne tombe pas sous le coup de cette loi extraterritoriale qui permet aux autorités américaines d’avoir accès aux données stockées par des entreprises domiciliées ou opérant sur le territoire des États-Unis.

Quelle solution technique votre association avec LightOn, Aleia et Numspot vous permet-elle de mettre en place ?

Concernant l’intelligence artificielle générative (IAG) nous avons voulu vérifier si nous pouvions être pertinent avec NumSpot qui est une infrastructure de Cloud que nous avons lancé avec la Banque des Territoires, le groupe Caisse des Dépôt et Dassault System et qui fonctionne en scale out (c’est-à-dire qu’elle est conçue pour augmenter ses capacités en ajoutant plus de ressources au fur et à mesure que la demande augmente, NDLR). Une infrastructure qui est labellisée SecNumCloud. Il s’agissait de vérifier si nous pouvions installer une solution de traitement de données française. Tout est parti d’un projet sur lequel Docaposte a endossé un rôle de locomotive, à savoir le projet MedAssistant qui vise à synthétiser et résumer des comptes-rendus médicaux. C’est une application qui traite tout ce qui concerne les dossiers des patients hospitalisés. Cela permet d’optimiser le traitement de ces informations par le médecin, ce qui lui permet de gagner in fine beaucoup de temps. Dans le cadre de ce projet qui part d’un besoin exprimé par les soignants, nous avons voulu vérifier si l’IA générative est utile. Ou non. Pour y parvenir, nous avons conjuguer les compétences de LightOn, Aleia et Numspot. Les résultats auxquels nous sommes parvenus nous ont paru concluant. Au point que nous proposons désormais une informatique de gestion basée sur l’IAG. Ce qui nous intéresse, c’est de trouver des usages utiles aux entreprises. Or, qu’est-ce qui les intéressent ? C’est de déployer des solutions d’IAG de manière sécurisée, en particulier sur l’aspect hébergement des données. Et de vérifier comment manipuler des ressources LLM (des modèles linguistiques de grande taille, comme ChatGPT, qui sont mis à disposition du public sous une licence open source, NDLR) de manière pertinentes, en matière de « prompting » (texte permettant de guider la production d’une IAG, NDLR) notamment.

Ce projet a nécessité des compétences spécifiques en matière de génération, d’hébergement, de traitement et d’analyse. Quelles sont les difficultés que vous avez rencontré d’un point de vue des ressources humaines pour le mener à terme?

La première difficulté, c’est de s’attaquer à quelque chose de nouveau, sur lequel nous n’avions aucun référent. Il est nouveau de faire tourner des LLM sur des GPU (c’est-à-dire utiliser une carte graphique pour exécuter et accélérer les calculs nécessaires au fonctionnement de ces modèles d’intelligence artificielle qui génèrent du texte en temps réel, NDLR). La seconde difficulté c’est de trouver les compétences nécessaires. Pour développer un tel modèle, nous avons besoin de data scientists capable d’endosser la fonction de « prompt engineer », des ingénieurs de script pour IA. Mais aussi des spécialistes du machine learning. Il est nécessaire de continuer à former des talents pour être capable de poursuivre le développement de ce que j’appelle l’informatique augmentée au service de l’entreprise.

La troisième difficulté, c’est de parvenir à régler les nombreuses questions, en matière de sécurité notamment, qui émergent quand on fait tourner un modèle de cette envergure.

Vous insistez sur le fait de travailler avec des acteurs français. Distinguez-vous le Made in France du « Code in France » ?

Chez Docaposte, nous pouvons seulement témoigner de ce que nous sommes capables de réaliser. Avec cette nouvelle application numérique, nous démontrons qu’il est possible de développer de l’IA générative sur de la donnée sensible sans avoir recours aux acteurs américains et de manière plutôt efficace. A la réflexion, je suis capable de définir ce qu’est le Made in France. Vous pouvez produire un vêtement ou une machine uniquement sur le territoire avec des matériaux extrait de notre sol. Le code, surtout quand on utilise des modèles open source, ne peut jamais être totalement français. Mais cette question est finalement très pertinente car elle pose celle des référentiels. Sur quoi s’appuie-t-on pour développer nos modèles et maintenir un lien de confiance avec notre écosystème ?

Pour susciter la confiance sur un projet nouveau comme celui-ci, jusqu’où êtes-vous prêt à aller ? Jusqu’à publier en open source le résultat de vos travaux pour l’ensemble de l’écosystème que vous avez mis en place ?

Nous utilisons l’open source mais nous ne publierons rien sous cette forme. Mais nous ne rechignons pas à expliquer notre architecture. Vis-à-vis de nos clients, en revanche, nous n’avons pas grand-chose à cacher. S’ils mandatent des experts pour connaitre et comprendre notre modèle, nous serons transparents avec eux. Mais beaucoup des organisations avec qui nous contractualisons n’ont pas de capacités d’expertise en interne. Il nous revient alors le rôle de former nos clients et de développer ce type de compétence en leur sein.

Quels sont vos objectifs commerciaux ?

Nous ne communiquerons pas sur ce sujet avant un an. Notre ambition, pour l’heure, c’est de démontrer que notre modèle fonctionne. Cette solution représentera-t-elle 1% ou 99 % du chiffre d’affaires de Docaposte dans 3 ans, je suis incapable de le dire. Ma conviction, c’est qu’il ne sert à rien d’essayer de concurrencer des outils grand public extraordinaires comme ChatGPT. En matière d’IAG, nous croyons beaucoup à la segmentation du marché en fonction des usages et des besoins des professionnels auxquels. Et c’est à eux que nous nous adressons.

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu

Intelligence artificielle générative : Docaposte tente le pari de la souveraineté pour séduire les professionnels