Quand Yann LeCun (Facebook) parle IA, données et applications

Hier matin, dans le cadre de la Rencontre Inria-Industrie sur « les données et leurs applications », l’institut accueillait les Français Francis Bach, responsable de l’équipe de recherche Sierra d’Inria et Yann LeCun, directeur de Facebook AI Research (Fair) et professeur à New York University (NYU) pour une matinée dédiée à l’apprentissage automatique.

Quand Yann LeCun (Facebook) parle IA, données et applications-300 En tant que chercheurs, Francis Bach et Yann LeCun savent brillamment parler de leur science, l’intelligence artificielle, aux non-initiés (dont je fais partie). Je n’irai pas pour autant vous répéter tous les propos entendus lors de cette matinée dédiée aux données et à leurs applications dans l’industrie, car le sujet reste complexe. Et pourtant…

Du premier, j’ai retenu quelques leçons, notamment que la « Data Science » est une science des données qui met en route toute une chaîne (techniques, outils, théories…), allant jusqu’à l’analyse et la visualisation (indispensable pour expliquer).

Francis Bach, responsable de l’équipe de recherche Sierra d’Inria, a aussi reprécisé ce qu’est l’intelligence artificielle selon lui : soit « ce qui essaie de reproduire les comportements humains (perception, jeu, raisonnement, planification…) ». C’est important de le dire car, a priori, utiliser les bons termes fait sens dans la profession, terminant par un « Attention au hype et aux multiples IA winters »…

Le chercheur est ensuite longuement revenu sur tout ce qui fonctionne dans l’apprentissage automatique. C’est-à-dire tout ce qui est l’apprentissage supervisé ; le passage à l’échelle par optimisation ; la haute dimension et parcimonie ; le filtrage collaboratif (recommandation personnalisée) et l’apprentissage profond (deep learning) avec les réseaux de neurones profonds. Puis, il a poursuivi avec ce qui fonctionne moins bien : l’apprentissage non supervisé (j’y reviendrai).

Enfin, à l’attention des industriels présents, il a terminé en listant les enjeux et opportunités pour le secteur, que sont :

  • Attirer les jeunes talents (à des salaires compétitifs si on ne veut pas les voir partir ailleurs !)
  • Donner accès aux données (mais attention aux –vieux- systèmes d’information existants)
  • Avoir des objectifs – quantitatifs – précis (ce qui impose donc d’avoir des données supervisées)
  • Et collaborer avec la recherche académique (nouveaux modèles)

« Aujourd’hui, les relations entre industrie et recherche académique évoluent, estime le chercheur. Ce n’est plus seulement des relations formelles via un contrat, ce peut être des relations plus informelles, comme par exemple du mécénat…. ». Pour répondre à un seul objectif : le time-to-market !

Le centre de recherche FAIR Paris, le plus grand de Facebook

Yann LeCun, très attendu, a poursuivi la séance (intense !) de travail. Son sujet : la puissance et les limites de l’apprentissage profond, et les projets de recherche sur lesquels il travaille chez Facebook, en tant que directeur scientifique de Facebook Research (FAIR).

Les équipes de ce Breton reconnu mondialement comptent 110 chercheurs sur deux continents, réparties entre l’Amérique (Etats-Unis et Montréal) et Paris, le plus important avec 35 personnes (lire encadré).

« Nos recherches sont très ouvertes », a-t-il précisé, présentant pour l’occasion Antoine Bordes, chercheur et animateur du laboratoire parisien du géant américain.

Yann LeCun a ensuite tenu à citer Josh Tennenbaum (« Tous les systèmes d’IA que vous voyez, aucun n’est vraiment de l’IA »), ajoutant que l’on manque encore de principes de base pour imiter les humains…

Toutefois, ces dernières années, « nous sommes passés aux systèmes d’apprentissage profond (deep learning) et, aujourd’hui, nous avons les données et les machines pour les faire fonctionner. » Depuis 2012-2013, il y a eu également beaucoup d’avancées sur l’analyse de l’image, avec le déploiement des réseaux convolutifs (alexNet, ResNet, GoogLeNet, DenseNet, VGG…) », dont il est l’un des inventeurs.

Parmi les applications les plus connues de ces réseaux, la conduite automatique : « Tous les systèmes actuels de pilotage automatique utilisent les réseaux convolutifs », mais l’on trouve d’autres applications dans le médical, les assistants virtuels, la traduction, le filtrage… Facebook travaille notamment sur la lecture poussée d’images… allant jusqu’à identifier le nombre de personnes sur une photo, et redessiner leurs mouvements.

Reste que les chercheurs en IA sont encore limités, a-t-il indiqué, « car ce qu’il manque aux ordinateurs, c’est le sens commun. Soit notre capacité à remplir les trous ou les infos manquantes, la capacité à prédire le futur… Il nous faut donc construire un modèle du monde pour pouvoir y évoluer. Ceci suggère un nouveau mode d’apprentissage, appelé l’apprentissage prédictif ou non supervisé ».

Mais, comment construire un modèle du monde, me direz-vous ? Par son observation essentiellement. « Chez Facebook, on travaille là-dessus, notamment sur StarCraft, a conclu le chercheur. Mais, avant d’utiliser l’apprentissage non supervisé, il va falloir encore trouver comment gérer le problème de l’incertitude liée à la prédiction… ». J’arrête là et si j’ai fait des erreurs, n’hésitez pas.

Les profils recherchés par Facebook Paris, selon Antoine Bordes

« On recrute des chercheurs doctorants ou post-doc, originaires de toute l’Europe. On recrute aussi des ingénieurs qui représentent 40 % de nos recrutements. A Paris, la situation un peu unique car on a une quinzaine de contrats Cifre. On prend aussi des stagiaires, en fin de mastère 2. On recrute enfin des ingénieurs de recherche qui sortent de l’école. On compte par exemple cinq thèses avec Inria, qui est notre partenaire privilégié. Avec 35 personnes au total, le centre parisien est l’un des plus gros sites de Facebook AI. Mais ce qui importe ce sont les contributions et les recherches. »

A lire aussi :