Ce que les responsables sécurité peuvent apprendre des « data scientist » pour améliorer la cybersécurité

[EXCLUSIF] La sécurité reste l’un des plus grands défis à relever pour les entreprises. Des milliards d’euros ont été investis en technologies au cours des 30 dernières années, et pourtant, les hackers semblent mieux se porter que jamais et toutes les organisations, peu importe leur taille, sont exposées en permanence à de graves menaces.

Michael Schiebel, Directeur Général Cybersécurité chez Hortonworks

La cybercriminalité est aujourd’hui bien plus complexe qu’auparavant et ne consiste plus simplement à rechercher et à exploiter des vulnérabilités pour pénétrer sur le réseau. Pourtant, la plupart des entreprises utilisent encore des outils qui visent ce type de comportements et sont donc obsolètes face à des menaces qui consistent souvent en des chaînes d’événements extrêmement complexes, survenant après que la sécurité du réseau a été compromise.

Ces outils fonctionnent encore souvent par rôle, en s’appuyant sur des signatures et des règles de détection-réponse, ce qui est leur principale faille. Les chaînes d’attaques modernes comportent en effet un plus grand nombre de phases, parmi lesquelles la reconnaissance, l’exploitation, l’élévation de privilèges, la propagation horizontale en interne, l’exfiltration de données et la pérennisation des accès.

Dans la mesure où la plupart des innovations dans le domaine du big data et de la sécurité relève aujourd’hui de la sphère open source, voici quelques conseils que les data scientists du monde entier ont acquis par expérience et que les professionnels de la sécurité seraient avisés de suivre.

Focalisez-vous sur les anomalies

La science des données consiste essentiellement à créer des structures à partir de données non structurées, puis à les formaliser pour comparer les tendances normales et anormales à l’aide d’algorithmes d’apprentissage automatique ou d’apprentissage profond. Quel que soit le domaine d’application, publicité par flux de clics, analyse du sentiment des acheteurs, algorithmes de reconnaissance faciale, prévision d’une pandémie ou modélisation de la propagation d’un programme malveillant, le principe de base d’analyse des données est le même, seul le scénario applicatif change.

Prenons par exemple l’analyse du sentiment des acheteurs, qui vise à déterminer les comportements d’achats « normaux » des clients : comment interagissent-ils avec les marques ? Quelles sont leurs pratiques d’achat standards ? L’idée est ici de mettre de côté les anomalies et les cas marginaux afin d’établir une classification des comportements normaux.

Qu’en est-il si je cherche maintenant à étudier les fraudes à la carte de crédit en ligne pour le même ensemble d’acheteurs ? Ce seraient alors les anomalies que je devrais étudier. Les données sont les mêmes, les techniques et les modèles analytiques aussi, mais cette fois, ce sont les irrégularités, non les cas de normalité, qui m’intéressent. Il est donc d’une importance cruciale qu’un fournisseur de solution de sécurité et un professionnel de la sécurité utilisent les mêmes données et, à peu de choses près, le même algorithme. Seul le point de vue change.

Utilisez TOUTES les données

Il s’agit là d’un aspect fondamental pour les data scientists qui n’est pas toujours évident pour les professionnels de la sécurité. Si vous souhaitez que votre solution de sécurité détecte TOUS les changements de comportements, vous devez intégrer des données d’activité brutes dans vos algorithmes d’apprentissage automatique, et non juste un flux d’événements pré-filtré.

Vous ne pouvez pas créer de modèles analytiques ni de profils comportementaux pour repérer les activités anormales si vous n’êtes déjà pas en mesure de détecter des comportements de base. Si votre idée est d’effectuer des analyses de sécurité à partir des alertes générées par une solution de sécurité classique, vous faites fausse route. Beaucoup de ces solutions traditionnelles ne sont pas à l’épreuve du terrain. Il est important de regarder la façon dont les outils analytiques de sécurité collectent les données, de déterminer l’origine de ces données, et de vérifier que ces outils permettent d’analyser un flux d’activités non filtré, que ce soit sur les données au repos ou en mouvement.

Il existe par exemple des solutions analytiques qui fournissent des algorithmes de machine learning permettant, une fois que ces dernières ont été couplées à un framework comme Hadoop, de construire des modèles pour être alerté lors de la détection d’anomalies.

Automatisez le plus possible

Pour beaucoup d’entreprises, le vrai problème tient au fait qu’elles reçoivent un trop grand nombre d’alertes de sécurité à un rythme trop rapide. Les équipes de réaction aux incidents sont en effet trop petites et trop occupées pour gérer, classifier et résoudre les problèmes de sécurité de façon efficace.

Certaines entreprises peuvent par exemple générer des centaines de milliers d’alertes par seconde ! Imaginons cependant, de façon hypothétique, qu’une grande société ne génère que 100 000 alertes par jour. Une équipe de quatre personnes qui consacrerait 30 minutes à chaque problème ne serait capable de traiter que 16 alertes par jour et par personne, soit un total de 64 incidents par jour et par équipe. La grande majorité des alertes ne pourrait donc pas être examinée, ce qui explique qu’il s’écoule en moyenne 145 jours avant que les situations à risque ne soient repérées. En réalité, beaucoup d’entreprises ne cherchent même pas…

Comment les équipes chargées de la sécurité peuvent-elles gérer un plus grand pourcentage d’alertes par jour ? Ou traiter en priorité celles qui sont potentiellement les plus graves ? Réponse : en automatisant massivement la détection des alertes et les mécanismes de réaction, permettant de réduire les temps de traitement de 30 à 2 minutes par événement.

En se focalisant sur les anomalies, en utilisant toutes les données à leur disposition et en automatisant les processus autant que possible, les équipes de réaction aux incidents et les entreprises seront mieux armées pour faire face aux chaînes d’attaques les plus complexes.

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu

Ce que les responsables sécurité peuvent apprendre des « data scientist » pour améliorer la cybersécurité

Focalisez-vous sur les anomalies

Utilisez TOUTES les données

Automatisez le plus possible

Suggestion de contenus