Le langage naturel dans le futur de l’IA

La capacité à traiter le langage naturel (comprendre : notre langage de tous les jours) représente un enjeu colossal pour les entreprises. Alors que leurs activités reposent largement sur des documents et des échanges écrits (avec l’email et les bases documentaires pour grands champions), celles qui sauront interpréter automatiquement ces données dites « non structurées », en extraire, en catégoriser et en analyser les éléments de sens, bénéficieront aussitôt d’un avantage concurrentiel décisif. Et c’est d’ores et déjà possible grâce à l’intelligence artificielle (IA). Killian Vermersch, CTO et co-fondateur chez Golem.ai, nous livre son analyse.

Killian Vermersch, CTO et co-fondateur chez Golem.ai

De l’épluchage des emails clients à l’examen de dossiers techniques, les cas d’usage sont innombrables. Prenons l’exemple d’un prestataire de services aux entreprises. L’analyse du contenu des appels d’offres qu’il reçoit peut lui permettre de ne sélectionner que les plus intéressants. Libérées de lectures inutiles et fastidieuses, les équipes consacrent davantage de temps à leur réponse, maximisant ainsi leurs chances de l’emporter.

Enfin, à partir des données extraites, les data scientists pourront dans un second temps déterminer les tendances ou les facteurs clés qui permettront d’affiner l’offre dans le futur. Efficacité du processus, rentabilité du modèle d’affaires, intérêt du travail pour les collaborateurs, dynamique d’amélioration continue : ce simple exemple laisse entrevoir toute l’étendue des bénéfices du traitement automatisé de l’écrit.

Le traitement automatique des langues (TAL, Natural Language Processing, NLP en anglais) est l’un des plus vieux sujets de recherche de l’intelligence artificielle, à laquelle il a fourni dans les années 1960 l’une de ses premières réalisations, l’agent conversationnel Eliza. Il comprend plusieurs domaines dont la traduction automatique, la génération de texte et la compréhension (Natural Language Understanding, NLU). C’est cette dernière discipline qui nous intéresse ici. De même que la linguistique est marquée par le débat entre les visions antagonistes de Noam Chomsky et de Jean Piaget, le NLU voit s’affronter deux approches radicalement différentes, l’IA symbolique et l’IA probabiliste. Pour faire émerger le sens, la première mise sur le raisonnement, sur le respect d’un ensemble de règles prédéfinies, tandis que la seconde se base sur l’identification de schémas récurrents et leur probable répétition.

L’IA symbolique présente énormément d’avantages. Tout d’abord, sa performance est sans limite puisque les règles, très stables s’agissant du langage, peuvent toujours être affinées et enrichies. C’est aussi une méthode transparente, qui explique ses résultats. Elle ne requiert que peu de ressources de calcul (un avantage tant économique qu’écologique) et peu de données, ce qui la préserve relativement des cybermenaces et des contraintes réglementaires (RGPD). Enfin, et surtout, c’est une méthode qui fonctionne et qui donne d’excellents résultats, d’ores et déjà supérieurs à l’humain, puisque la machine ne se trompe pas, n’oublie pas, ne fatigue pas.

En face, l’IA probabiliste souffre de plusieurs handicaps, particulièrement pénalisants sur ce sujet : son besoin de quantités énormes de données, sa gourmandise en puissance de calcul, son opacité quant à la manière dont le résultat a été obtenu. En revanche, elle dispose de la force de frappe inégalable des GAFAM, qui ont poussé partout cette méthode qui correspond à la fois à leurs atouts, à leur modèle économique et à leur culture. Tant et si bien que, sous l’appellation Deep Learning, l’IA probabiliste est aujourd’hui devenue synonyme d’IA tout court, éclipsant pratiquement sa rivale symbolique dans l’esprit du public. Pourtant, aussi pertinent soit-il sur certains problèmes, comme la reconnaissance d’image ou la prédiction de pannes, le Deep Learning ne saurait être considéré ni comme la panacée, ni comme la seule voie pour l’IA.

L’histoire des technologies est jalonnée de luttes où l’ont emporté non pas les meilleures solutions, mais celles qui bénéficiaient du meilleur marketing. Aujourd’hui, cela pourrait se reproduire avec le Deep Learning. Et tout le monde en pâtirait car ce sont uniquement les travers du Deep Learning qui freinent l’acceptation et l’essor de l’IA. Répétons-le : l’IA symbolique est une IA explicable, maîtrisable, qui ne reproduit pas les biais du passé et qui n’engloutit pas des quantités astronomiques de données et d’énergie.

Le traitement automatique des langues pourrait donc se révéler un champ de bataille décisif pour l’avenir de l’IA. Si l’IA symbolique s’y imposait, comme le justifieraient ses atouts, cela mettrait un coup d’arrêt à l’hégémonie du Deep Learning. Surtout, cela changerait la perception de l’IA, qui redeviendrait cette très riche boîte à outils dans laquelle les entreprises peuvent choisir l’approche – symbolique, probabiliste ou mixte – la plus adaptée à leur problème.

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu

[Tribune] Le langage naturel, une bataille décisive pour le futur de l’IA

Suggestion de contenus