Quand Yann LeCun (Facebook) parle IA, données et applications

Hier matin, dans le cadre de la Rencontre Inria-Industrie sur « les données et leurs applications », l’institut accueillait les Français Francis Bach, responsable de l’équipe de recherche Sierra d’Inria et Yann LeCun, directeur de Facebook AI Research (Fair) et professeur à New York University (NYU) pour une matinée dédiée à l’apprentissage automatique.

En tant que chercheurs, Francis Bach et Yann LeCun savent brillamment parler de leur science, l’intelligence artificielle, aux non-initiés (dont je fais partie). Je n’irai pas pour autant vous répéter tous les propos entendus lors de cette matinée dédiée aux données et à leurs applications dans l’industrie, car le sujet reste complexe. Et pourtant…

Du premier, j’ai retenu quelques leçons, notamment que la « Data Science » est une science des données qui met en route toute une chaîne (techniques, outils, théories…), allant jusqu’à l’analyse et la visualisation (indispensable pour expliquer).

Francis Bach, responsable de l’équipe de recherche Sierra d’Inria, a aussi reprécisé ce qu’est l’intelligence artificielle selon lui : soit « ce qui essaie de reproduire les comportements humains (perception, jeu, raisonnement, planification…) ». C’est important de le dire car, a priori, utiliser les bons termes fait sens dans la profession, terminant par un « Attention au hype et aux multiples IA winters »…

Le chercheur est ensuite longuement revenu sur tout ce qui fonctionne dans l’apprentissage automatique. C’est-à-dire tout ce qui est l’apprentissage supervisé ; le passage à l’échelle par optimisation ; la haute dimension et parcimonie ; le filtrage collaboratif (recommandation personnalisée) et l’apprentissage profond (deep learning) avec les réseaux de neurones profonds. Puis, il a poursuivi avec ce qui fonctionne moins bien : l’apprentissage non supervisé (j’y reviendrai).

Enfin, à l’attention des industriels présents, il a terminé en listant les enjeux et opportunités pour le secteur, que sont :

Attirer les jeunes talents (à des salaires compétitifs si on ne veut pas les voir partir ailleurs !)
Donner accès aux données (mais attention aux –vieux- systèmes d’information existants)
Avoir des objectifs – quantitatifs – précis (ce qui impose donc d’avoir des données supervisées)
Et collaborer avec la recherche académique (nouveaux modèles)

Lien gagnant-gagnant entre industrie et académique et ses enjeux avec @BachFrancis @inria_paris #Inria_industrie @Inria_Saclay pic.twitter.com/ENzu6zKjtg

— Inria (@Inria) 18 octobre 2017

« Aujourd’hui, les relations entre industrie et recherche académique évoluent, estime le chercheur. Ce n’est plus seulement des relations formelles via un contrat, ce peut être des relations plus informelles, comme par exemple du mécénat…. ». Pour répondre à un seul objectif : le time-to-market !

Le centre de recherche FAIR Paris, le plus grand de Facebook

Yann LeCun, très attendu, a poursuivi la séance (intense !) de travail. Son sujet : la puissance et les limites de l’apprentissage profond, et les projets de recherche sur lesquels il travaille chez Facebook, en tant que directeur scientifique de Facebook Research (FAIR).

Les équipes de ce Breton reconnu mondialement comptent 110 chercheurs sur deux continents, réparties entre l’Amérique (Etats-Unis et Montréal) et Paris, le plus important avec 35 personnes (lire encadré).

« Nos recherches sont très ouvertes », a-t-il précisé, présentant pour l’occasion Antoine Bordes, chercheur et animateur du laboratoire parisien du géant américain.

Yann LeCun a ensuite tenu à citer Josh Tennenbaum (« Tous les systèmes d’IA que vous voyez, aucun n’est vraiment de l’IA »), ajoutant que l’on manque encore de principes de base pour imiter les humains…

Toutefois, ces dernières années, « nous sommes passés aux systèmes d’apprentissage profond (deep learning) et, aujourd’hui, nous avons les données et les machines pour les faire fonctionner. » Depuis 2012-2013, il y a eu également beaucoup d’avancées sur l’analyse de l’image, avec le déploiement des réseaux convolutifs (alexNet, ResNet, GoogLeNet, DenseNet, VGG…) », dont il est l’un des inventeurs.

il existe la possibilité d’une intelligence sans langage (merci M. Poulpe 😉) #inria_industrie avec @ylecun @inria_paris @Inria_Saclay pic.twitter.com/IeXo75pikP

— Inria (@Inria) 18 octobre 2017

Parmi les applications les plus connues de ces réseaux, la conduite automatique : « Tous les systèmes actuels de pilotage automatique utilisent les réseaux convolutifs », mais l’on trouve d’autres applications dans le médical, les assistants virtuels, la traduction, le filtrage… Facebook travaille notamment sur la lecture poussée d’images… allant jusqu’à identifier le nombre de personnes sur une photo, et redessiner leurs mouvements.

Reste que les chercheurs en IA sont encore limités, a-t-il indiqué, « car ce qu’il manque aux ordinateurs, c’est le sens commun. Soit notre capacité à remplir les trous ou les infos manquantes, la capacité à prédire le futur… Il nous faut donc construire un modèle du monde pour pouvoir y évoluer. Ceci suggère un nouveau mode d’apprentissage, appelé l’apprentissage prédictif ou non supervisé ».

on découvre et on se construit un modèle du monde par observation essentiellement @ylecun @facebook #inria_industrie pic.twitter.com/aY5Et0n4X9

— Inria (@Inria) October 18, 2017

Mais, comment construire un modèle du monde, me direz-vous ? Par son observation essentiellement. « Chez Facebook, on travaille là-dessus, notamment sur StarCraft, a conclu le chercheur. Mais, avant d’utiliser l’apprentissage non supervisé, il va falloir encore trouver comment gérer le problème de l’incertitude liée à la prédiction… ». J’arrête là et si j’ai fait des erreurs, n’hésitez pas.

À résoudre : comment entraîner ses modèles prédictifs du monde et gérer le doute de la prédiction @ylecun @facebook #inria_industrie pic.twitter.com/fR21CSBeBF

— Inria (@Inria) October 18, 2017

Les profils recherchés par Facebook Paris, selon Antoine Bordes

#FAIR on recrute plutôt des doctorants, post-doc, ingénieurs, stagiaires : 35 pers à @facebook AI #research le + gros labo #inria_industrie pic.twitter.com/aRH6pMxojy

— Inria (@Inria) 18 octobre 2017

« On recrute des chercheurs doctorants ou post-doc, originaires de toute l’Europe. On recrute aussi des ingénieurs qui représentent 40 % de nos recrutements. A Paris, la situation un peu unique car on a une quinzaine de contrats Cifre. On prend aussi des stagiaires, en fin de mastère 2. On recrute enfin des ingénieurs de recherche qui sortent de l’école. On compte par exemple cinq thèses avec Inria, qui est notre partenaire privilégié. Avec 35 personnes au total, le centre parisien est l’un des plus gros sites de Facebook AI. Mais ce qui importe ce sont les contributions et les recherches. »

A lire aussi :

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu

Quand Yann LeCun (Facebook) parle IA, données et applications

Le centre de recherche FAIR Paris, le plus grand de Facebook

Les profils recherchés par Facebook Paris, selon Antoine Bordes

Suggestion de contenus