Pas de véritable explicabilité pour ChatGPT

Alors que l’on crie à qui veut l’entendre depuis quelques semaines que ChatGPT et les autres systèmes d’IA générative accuseraient pour la première fois une baisse d’intérêt de la part du grand public, leur potentiel reste encore majoritairement inexploité. Bien sûr, ces derniers présentent encore des limites pour une exploitation dans le contexte de l’entreprise. Qu’il s’agisse d’« hallucinations », de désinformation, de préjugés ou d’un manque d’explicabilité, l’utilisation de l’intelligence artificielle (IA) dans le contexte des « grands modèles de langages » (Large Language Models ou LLM) relève davantage de la curiosité que du substantiel. Nicolas Rouyer, consultant senior avant-vente chez Neo4j, nous livre son analyse.

La « menace » que représentent les LLM suscite également des craintes. Certains leaders appellent les chercheurs en IA à ralentir la production afin que les risques puissent être étudiés dans le cadre d’une « prise de recul vis-à-vis de la course dangereuse vers des modèles de type boîte noire imprévisibles de plus en plus grands et dotés de nouvelles capacités ». Elon Musk, qui prévoit d’introduire sa propre IA générative, affirme qu’il craint que ChatGPT soit intrinsèquement biaisé.

Il y a là un débat à mener. Quoi qu’il en soit, l’IA générative a encore une belle marge de progression pour offrir une véritable visibilité et instaurer de la confiance. Mais pour jeter les bases de cette démarche, nous devons être clairs sur ce que ChatGPT et ses producteurs de textes LLM ne sont pas. Ces derniers ne sont pas assez sensibles et ne peuvent pas remplacer entièrement la nécessité pour vous et moi de rédiger des articles, des essais ou des brochures, même s’ils peuvent nous aider dans les tâches de rédaction initiales.

Et comme la technologie a assimilé de nombreux exemples de code informatique, elle constitue également une ressource précieuse pour améliorer l’efficacité des développeurs. Mais au-delà de faciliter la génération de codes et de textes, pour exploiter pleinement la puissance de l’IA générative, nous devons former sa prochaine génération sur des données commerciales structurées et de haute qualité, plutôt que de nous fier à « ce qui existe » gratuitement sur internet.

Et l’un des meilleurs moyens pour y parvenir serait d’utiliser un graphe de connaissances comme support et interface. Cette approche est la meilleure façon de parvenir à l’explicabilité, à la conformité et à la reproductibilité, tout en offrant aux concepteurs de systèmes les nombreux autres avantages qu’apportent les graphes de connaissances et la science des graphes.

Dans les faits, les entreprises commencent à adopter davantage cette approche. Pour prendre un exemple concret, une société pétrolière et gazière de Singapour a essayé un LLM pour ses recherches à l’échelle de l’entreprise, mais comme l’IA ne savait pas ce qu’elle cherchait, les résultats n’avaient qu’une valeur limitée. Toutefois, en utilisant des graphes pour donner du contexte, l’entreprise a été en mesure d’accroître la précision et la pertinence de son IA.

Et cette démarche est à la portée de n’importe quelle organisation : qui peut alors accumuler un volume important de données textuelles, qu’elles soient externes (relatives au marché spécifique) ou internes (telles que des catalogues de produits).

La clé pour en finir avec les erreurs de ChatGPT ?

En utilisant le nouveau LLM synthétisé, il est possible de créer un graphe de connaissances qui aidera à donner un sens aux données accumulées en accélérant la R&D ou en affinant les procédures de conformité. On peut également utiliser ce processus en sens inverse en appliquant un modèle de langage intelligent à un espace de problème que l’on a encodé dans un graphe. On peut ainsi contrôler l’entrée du modèle, ce qui permet d’obtenir une interface en langage naturel réactive et facile à interroger au-dessus de son graphe, sans qu’il soit nécessaire de déployer des efforts considérables pour y parvenir. Cette approche permet également de réduire radicalement le type d’erreurs que l’on observe avec ChatGPT.

C’est ce qu’on appelle dans le jargon scientifique SLM pour « small language model », qui sera bientôt très répandu dans les applications industrielles et commerciales.

A titre d’exemple, un e-retailer peut se servir de cette approche et incorporer toute la documentation de ses produits à partir de ses bases de données, la charger dans ChatGPT et offrir à ses clients un chatbot conversationnel interactif qui maitriserait toute cette complexité.

Les DSI devraient regarder au-delà des spéculations fantasques à propos de ChatGPT et se concentrer sur l’exploration du potentiel inexploité de leurs entrepôts de données internes en appliquant les LLM et en construisant des graphes de connaissances à l’aide d’algorithmes de science des données de graphes. Ils n’ont alors plus qu’à réinventer le champ des possibles.

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu

[Tribune] Pas de véritable explicabilité pour ChatGPT sans la technologie des graphes

La clé pour en finir avec les erreurs de ChatGPT ?

Suggestion de contenus