La SNCF prédit les retards de trains avec l’intelligence artificielle

Cet article a été publié originellement sur mydatacompany.fr

La SNCF a mis en production une solution d’intelligence artificielle servant à prédire les retards de train du lendemain. L’information alimente ainsi les recommandations d’itinéraires. Le système pourrait être pleinement automatisé pour les JO de Paris en 2024.

Dans différents domaines de son activité, l’intelligence artificielle développée par la SNCF n’aboutira jamais à une décision automatique. Cette prise de décision relèvera toujours d’un humain. C’est le cas dans la maintenance, la supervision et le suivi des flots de passagers en station.

« Un humain restera toujours dans la boucle puisque les données ne pourront jamais capturer suffisamment de contexte » justifie Eloïse Nonne, directrice Data Science & Engineering d’Itnovem (e.SNCF), le centre d’expertise numérique de la SNCF.

 

Des recommandations d’itinéraires basées sur des prédictions de retards

Un humain demeure indispensable en raison de sa capacité à analyser une situation dans son ensemble. Certains cas d’usage du Machine Learning permettent toutefois d’automatiser des décisions. Une condition cependant : « éviter ou réduire les risques » d’erreur.

C’est le cas d’un projet de prédiction des retards désormais en production à la SNCF. « Nous prédisons les retards toutes les nuits pour plusieurs trains du lendemain (…) afin de fournir des informations sur le meilleur itinéraire » présente l’experte en Data science. Cet algorithme devra être pleinement opérationnel à l’occasion des JO de Paris en 2024.

L’erreur ne sera pas permise lors des JO de Paris

« Nous devrons gérer un énorme volume de passagers sur Paris et sa périphérie. Nous n’aurons pas le droit à l’erreur. Il sera impossible de rediriger un flux de passagers sans conséquence. Conserver un humain dans la boucle n’est pas possible, la décision devant être prise rapidement. »

Par ailleurs, la SNCF explore et met en production des cas d’usage de l’intelligence artificielle dans des domaines très variés. Cela va de la consommation d’énergie à l’information voyageurs. Pour cela, la compagnie s’appuie notamment sur son centre d’expertise.

Pour Eloïse Nonne, la difficulté initiale en la matière consiste à comprendre le véritable besoin métier. « Les opérateurs vous demanderont, par exemple, de la maintenance prédictive. En vérité, il vous faudra définir un besoin beaucoup plus précis. Pour mettre de l’intelligence artificielle en production, vous devez prendre une décision, critique ou non, mais sur une base opérationnelle. »

Aiguillages : détecter ou anticiper les anomalies ?

C’est ce besoin et la décision qui en découle que cherchent à déterminer actuellement les Data Scientists de la SNCF pour la gestion du réseau ferroviaire. Pour assurer la circulation quotidienne de 15.000 trains, l’entreprise s’appuie sur un système composé de 3.000 aiguillages. La maintenance et la surveillance de ces équipements sont donc critiques.

« Si nous voulons prédire ou détecter des anomalies, nous devons nous concentrer précisément sur ce que nous cherchons à trouver lors de la conception du modèle » débute la responsable. « Le but est-il d’identifier une anomalie critique qui déclenche une décision immédiate avec un coût important car obligeant à l’arrêt des trains ? Ou devons-nous essayer d’anticiper une anomalie ? La solution sera profondément différente selon le scénario » souligne Eloïse Nonne.

La grande difficulté de l’intelligence artificielle c’est la conduite du changement

La spécification précise du besoin n’est pas la seule source de complexité cependant, souligne-t-elle. La mise en production de l’intelligence artificielle implique aussi une conduite du changement auprès de métiers utilisateurs des résultats de l’IA.

« C’est la partie la plus complexe, je pense. Vous travaillez avec des personnes qui ne sont pas familières de ces nouvelles technologies. Et vous-mêmes [NDLR : les Data scientists] n’êtes pas familiers de leurs processus » insiste la Data scientist, qui pilote une équipe de 30 personnes. Un tiers de cet effectif se compose Data scientists. Ceux-ci sont dédiées au développement de solutions d’intelligence artificielle et à leur mise en production.

Une trentaine de projets est aujourd’hui en production, dont une partie fait appel au Machine Learning, confie-t-elle. Pour ces réalisations, l’équipe utilise depuis plusieurs mois désormais la même usine logicielle que le reste du groupe.   

Les priorités en termes de projets portent sur « la régularité des trains, l’amélioration de la sécurité, la réduction de la consommation d’énergie et la fourniture d’une meilleure information aux voyageurs » conclut-elle.