En avril, le ministère des Armées lançait l’Energy Data Hack, un grand hackathon en ligne auprès des étudiants comme des agents de la fonction publique. L’objectif était simple : réunis en équipes, les participants devaient relever le défi de la donnée au service de la stratégie énergétique à travers l’un des quatre challenges proposés. Plus de 120 étudiants des Majeures SRS (Systèmes, Réseaux et Sécurité) et SCIA (Data Science et Intelligence Artificielle) ont alors redoublé d’ingéniosité pour réussir ce challenge, permettant à trois équipes d’EPITéens de s’adjuger les 2e, 3e et 4e places au classement général !
Martin Labé, étudiant en 4e année au sein de la Majeure SCIA, fait partie des lauréats. Avec son équipe surnommée « Consommateurs » et composée de ses camarades de promotion Simon Llagone, Benoit Pham, Victor Dutto et Cécile Pérou, il s’est ainsi hissé jusqu’à la deuxième place de ce challenge réunissant plus de 225 participants et près de 54 équipes ! Le futur ingénieur revient aujourd’hui sur cette belle performance collective associant intelligence artificielle et Data Science qui permettra aux lauréats de visiter prochainement le labo BI et Big Data du ministère des Armées !
Tout d’abord, pourquoi as-tu choisi la Majeure SCIA à l’EPITA ?
Martin Labé : J’ai intégré l’ÉPITA après une expérience en tant qu’élève-officier à l’École de l’Air. J’ai rejoint la formation en 3e année, soit la première du Cycle Ingénieur, et m’intéressais alors surtout aux drones et à la cybersécurité. Durant cette année, j’ai pu explorer en profondeur les aspects techniques et théoriques, mais surtout découvrir encore davantage de domaines passionnants. J’ai également rejoint le laboratoire SEAL de l’école, spécialisé en robotique d’exploration, domaine dans lequel j’ai effectué un stage de 4 mois. Les problématiques liées aux traitements des données et à l’automatisation des robots en exploration sous-marine m’ont alors immédiatement orienté vers le Machine Learning. D’ailleurs, les applications possibles de l’intelligence artificielle permettent de répondre à énormément d’enjeux actuels, en matière d’environnement, de sécurité… C’est ce qu’on a pu voir durant ce hackathon et c’est-ce qui m’a incité à choisir la Majeure SCIA.
Quel était justement le principe du Energy Data Hack ?
Il fallait utiliser des données relatives à l’énergie et tenter de les « hacker », c’est-à-dire de trouver de nouvelles façons de les utiliser, de les exploiter. Les possibilités étaient nombreuses, de la récupération de mots de passe via des interférences électromagnétiques à la réduction de la facture énergétique des ministères. Nous, au sein de notre équipe, nous avons plutôt fait le choix de nous orienter vers l’utilisation de ces données à des fins malveillantes. En effet, les données que nous pouvions utiliser étaient toutes celles déjà disponibles en Open Data, c’est-à-dire gratuites, libres pour utilisation et accessibles via Internet. Nous avons donc commencé à voir quelles informations extraire afin de créer un scénario d’attaque pouvant, par exemple, déstabiliser une entité.
On peut imaginer un tel scénario avec des données facilement accessibles ?
Si, quand on a beaucoup d’informations, on arrive à les traiter et les isoler d’une certaine manière, on peut effectivement parvenir à les mettre en lien pour élaborer une approche malveillante. Nous avons ainsi réussi à lier différentes bases de données. L’idée de départ de notre scénario était de montrer qu’il était possible de déstabiliser un domaine précis à travers des données énergétiques : celui de l’industrie de l’armement. Pour cela, nous avons commencé par éplucher la base de données de l’INSEE recensant toutes les entreprises basées en France selon leur domaine d’activité. À partir de là, nous avons pu identifier et localiser différentes entreprises liées à des secteurs ayant des applications militaires. Via un algorithme, nous avons ensuite isolé des clusters, c’est-à-dire des zones géographiques où plusieurs entreprises étaient regroupées et pouvaient potentiellement être en lien les unes avec les autres. Dès lors, après avoir défini une « cible », nous avons utilisé plusieurs bases de données liées au secteur de l’énergie. Cela nous a permis de voir de quelles sources d’énergie dépendaient ces industries. Le dernier point de l’attaque consistait enfin à reconstituer le réseau de distribution en le transposant grâce à la théorie des graphes et du problème dit du « marchand ambulant », puis de déterminer une liste de points sensibles qui, s’ils étaient attaqués, permettraient potentiellement de déstabiliser notre cible.
Avez-vous, durant ce hackathon, également pensé à une solution pour faire face à ce scénario ?
Pas du tout ! Nous avons vraiment concentré nos forces sur l’élaboration de ce scénario que nous voulions à la fois réaliste et, surtout, actuel : on ne voulait pas d’un scénario susceptible d’arriver dans 5 ou 10 ans. D’ailleurs, pour l’utilisation des données énergétiques, le hackathon permettait d’explorer plusieurs pistes, mais nous avons préféré nous focaliser sur la dépendance des grands acteurs industriels, comme les entreprises du GICAT, car leurs sites de production représentent de très gros consommateurs d’électricité.
Certaines équipes EPITéennes associaient des étudiants des deux Majeures tandis que la vôtre était 100 % SCIA. Pour quelle raison ?
Parce que nous voulions dès le départ faire un gros travail essentiellement tourné vers la data, pour extraire, trouver, traiter et visualiser l’information avec nos propres algorithmes. Avec les données, il y a vraiment un moyen d’être très créatif !
C’est d’ailleurs une bonne manière de présenter le rôle d’un Data Scientist qui, par son travail, est capable de trouver comment affiner et raffiner une donnée brute.
C’est exactement ça. Le but de ce métier est de vraiment donner du sens aux données, de bien les visualiser et les comprendre à l’aide d’une boîte à outils, d’algorithmes. D’où notre nom d’équipe et la description qui l’accompagnait : nous nous présentions comme « des Data Scientists fous prêts à consommer tous types de données » !
Quel a été, pour toi, le plus grand défi à relever ?
Probablement la gestion du temps ! C’était notre premier hackathon et il a fallu trouver la bonne organisation, le bon équilibre au sein de l’équipe pour travailler toute la semaine sans avoir omis de développer certaines parties ou aller trop vite sur d’autres.
Durant le hackathon, les participants n’étaient pas seuls et pouvaient bénéficier du soutien d’experts en data science, data analyse, stratégie énergétique et renseignement. Quel rôle ont-ils joué auprès de votre équipe ?
Être entourés de mentors a peut-être été la chose que nous avons le plus appréciée durant ce hackathon. C’était vraiment intéressant de pouvoir parler avec ces experts du ministère des Armées, leur présenter nos travaux, échanger sur nos idées, recevoir leurs conseils… Nous avions deux mentors, l’un qui nous a aidés sur la scénarisation de l’attaque et donné des pistes sur les bases de données en Open Data et l’autre qui nous a surtout aidés sur le réseau électrique et l’utilisation des bases de données.
Enfin, quelle a été votre réaction quand vous avez appris votre belle performance ?
Nous étions fous de joie et surtout très fiers de voir que notre travail avait pu retenir l’attention du jury. Surtout, nous sommes tous très enthousiastes à l’idée de pouvoir, grâce à ce prix, visiter le labo BI et Big Data. Ce sera une occasion unique de voir comment les experts travaillent là-bas et, potentiellement, d’éventuellement y obtenir un stage pour la suite de nos études.
Les équipes de l’EPITA lauréates de l’Energy Data Hack
- 2e prix : L’équipe “Consommateurs” composée de Simon Llagone, Martin Labé, Benoit Pham, Victor Dutto et Cécile Pérou (EPITA promo 2022)
- 3e prix : L’équipe “Les chacaux trigrés” composée d’Etienne Sharpin, Ségolène Denjoy, Sébastien Hoehn, Charles Duchamp et Cédric Farinazzo (EPITA promo 2022)
- 4e prix : L’équipe “Rahan” composée de Nicolas Robert, Raphael Nodenot, Antoine Caille et Hugo Rosenkranz-Costa (EPITA promo 2022)