De l’IPSA à la recherche. Si, à la fin du cursus d’ingénieur, nombreux sont les IPSAliens à rejoindre de grands noms des secteurs de l’air et de l’espace, certains font le choix de démarrer une carrière dans la recherche. C’est le cas d’Atilla Kaan Alkan (IPSA promo 2020) qui vient de commencer une thèse au croisement de l’intelligence artificielle et de l’astrophysique, intitulée « Traitement Automatique des Langues pour l’analyse de messages d’observation astrophysique » et financée par l’école doctorale STIC (Université Paris-Saclay).
Comment en es-tu arrivé à rejoindre l’IPSA ?
J’ai un parcours plutôt classique. Après un Bac scientifique spécialisation mathématiques, j’ai fait deux ans de Classe préparatoire aux grandes écoles PCSI/PSI*. Ensuite, c’est surtout ma passion pour l’astronomie, l’astrophysique et le monde du spatial en général qui m’a guidé dans mes choix d’orientation et mon envie d’aller à l’IPSA pour, plus tard, rejoindre la Majeure Espace, lanceurs et satellites. Cette dernière m’a ainsi permis d’étudier des modules en astronomie fondamentale, en astrophysique ou encore en physique des plasmas.
D’où te vient cette passion ?
Elle remonte à l’enfance, avec mes premiers voyages. Prendre l’avion m’intriguait si bien que j’ai commencé à me prendre de passion pour l’aéronautique. Par la suite, j’ai voulu rêver plus grand encore et voir plus loin en me plongeant dans cet univers si intriguant qu’est l’espace !
Quel bilan tires-tu de ces trois années passées à l’IPSA ?
Ces années à l’IPSA se sont très bien passées ! Elles m’ont apporté une certaine rigueur dans mon travail, de l’autonomie et une plus grande curiosité également. En effet, contrairement au lycée ou en classe préparatoire, l’IPSA ne vous sert pas toutes les informations sur un plateau : il y a énormément de travail personnel à fournir en parallèle, ce qui permet de développer ces compétences ainsi qu’une grande capacité d’adaptation qui m’a notamment servi lors de mes stages.
À quel moment as-tu su que tu allais choisir la recherche à l’issue de ton cursus ?
Le déclic est intervenu lors de mon projet de fin d’études. C’est justement ce projet ayant pour thématique le traitement automatique des langues (TAL) qui m’a permis de m’initier au monde de la recherche. Comme ce travail m’a plu, j’ai voulu continuer à explorer ce champ de recherche qu’est le TAL durant mon stage de fin d’études, réalisé au sein du Laboratoire de la Donnée du ministère de l’Intérieur. Ces deux expériences n’ont fait que me conforter dans l’idée que mon avenir était lié à la recherche. Il fallait que je poursuive dans cette voie !
Qu’est-ce que le traitement automatique des langues ?
Le traitement automatique des langues (TAL) – aussi appelé « traitement automatique du langage naturel » (TALN) – est un champ de recherche qui a vu le jour au milieu du siècle dernier, quand la course pour la conquête de l’espace entre l’URSS et les États-Unis battait son plein. À cette époque, chacune de ces deux puissances suivait de très près les publications techniques de l’autre. Or, comme les États-Unis se confrontaient à la barrière de la langue, ils ont mis au point informatiquement un traducteur de textes russes, marquant ainsi le début du TAL. Aujourd’hui, les choses ont évolué et le TAL ne se cantonne plus à la traduction : cette discipline est désormais l’une des branches de l’intelligence artificielle et se trouve à l’intersection de l’informatique, de la linguistique, des sciences cognitives et des statistiques. L’objectif du TAL est ainsi de « modéliser » le langage humain – c’est pour cela qu’on parle de « langage naturel » – et de reproduire informatiquement la capacité humaine à créer et comprendre des énoncés linguistiques. Parmi les applications très concrètes du TAL, on peut par exemple citer l’extraction d’informations, l’analyse de sentiments, le dialogue homme-machine ou encore la recherche de réponses à des questions, comme sur un chatbot par exemple.
Ta thèse porte sur une autre application, cette fois liée à l’astrophysique.
Absolument ! Comme pour les langues générales (français, anglais, chinois…), les langues en domaine spécialisé (clinique, biomédicale…) possèdent également leur propre terminologie. Par conséquent, la langue astrophysique ne fait pas exception. Ma thèse consiste donc à proposer et développer des méthodes de traitement automatique des langues qui s’attaquent aux enjeux de l’extraction et de la synthèse d’information à partir de corpus de textes en lien avec l’astrophysique pour permettre le repérage des éléments porteurs d’information au sein des textes.
Quels genres de textes ?
Des rapports d’observation. En effet, l’astrophysique est un domaine très actif et une grande partie de cette activité repose sur l’observation des événements cosmiques transitoires les plus violents, tels que les sursauts de rayon gamma, les sursauts radio rapides ou encore les ondes gravitationnelles. Les astrophysiciens diffusent ensuite les informations relatives à ces observations par les canaux de communication que sont les circulaires et les télégrammes qui, ensemble, constituent ces fameux rapports d’observation. Le problème est qu’on se heurte à la nature textuelle de ces informations. Or, ces textes portant de la connaissance, il est essentiel de pouvoir les rendre accessibles. D’où l’objectif de ma thèse qui est de développer une méthode de TAL permettant de repérer, d’extraire et de synthétiser les informations issues de ces rapports pour les fournir aux astrophysiciens.
Par exemple, en astrophysique des hautes énergies ou en astrophysique des événements transitoires, les informations se trouvent sous deux types de formes : des données interprétables directement par des machines – ces dernières sont directement traitées et évaluées en temps réel par la plateforme Astro-COLIBRI, il n’y a alors pas besoin de méthode de TAL – et des rapports d’observation. Le fruit du travail de ma thèse pourra permettre à la communauté d’astrophysique d’accéder en temps réel à ces informations essentielles. Je peux ainsi espérer contribuer indirectement à une meilleure compréhension de l’univers !
Où effectues-tu ta thèse ?
Je la fais à l’Université Paris-Saclay, au sein du Laboratoire interdisciplinaire des sciences du numérique (LISN), qui est un laboratoire du CNRS. La thèse est en codirection avec l’Institut de recherche sur les lois fondamentales de l’univers (Irfu), un institut du CEA justement basé à Saclay. D’ailleurs, comme cette thèse est à cheval entre deux domaines – le TAL et l’astrophysique –, j’ai deux directeurs de thèse : un premier spécialisé dans l’extraction d’informations et un second en expertise astrophysique. Je suis aussi encadré par une troisième personne, également spécialiste en TAL. C’est aussi cela qui fait la richesse de cette thèse, puisqu’elle me permet de travailler avec des experts en TAL, mais également de collaborer à l’échelle internationale avec des astrophysiciens et des astronomes de tout horizon.
T’attendais-tu à ce que ta thèse fasse l’objet d’un financement de l’école doctorale ?
En fait, ce sujet de doctorat proposé par l’école doctorale faisait l’objet d’un financement sur concours. Pour cela j’ai postulé à deux différentes sources de financement : l’un auprès de l’école doctorale et l’autre auprès de l’Université Paris-Saclay. Le financement de l’école doctorale est un financement ministériel : il est souvent considéré comme difficile à obtenir car il n’est attribué qu’aux candidats faisant partie des meilleurs au classement de l’école doctorale. Le financement de Paris-Saclay dont je parle passe lui par le programme UDOPIA qui finance chaque année uniquement 30 thèses en intelligence artificielle. Et, finalement après les oraux d’admission, j’ai eu la chance et l’honneur de voir mon dossier retenu pour ces deux sources de financement ! Évidemment, aujourd’hui, je n’en bénéficie que d’une seule, à savoir celle de l’école doctorale. Je ne peux qu’être reconnaissant envers mes trois encadrants de thèse, car ils m’avaient avant tout offert la possibilité de faire un stage pré-thèse au sein de leur laboratoire afin de défricher ce sujet de recherche, mais je les remercie également pour leur précieux conseils lors de la préparation de l’oral d’admission.
Qu’est-ce qui te plaît dans la recherche ?
Il y a d’abord ce que j’ai justement découvert durant mon projet de fin d’études : la méthode de travail ! Cette approche scientifique et empirique, qui permet d’acquérir de la connaissance et un savoir au fur et à mesure des expérimentations, me convient parfaitement. D’ailleurs, après cette thèse qui durera trois ans, je compte poursuivre dans la recherche en effectuant des études postdoctorales et décrocher l’habilitation à diriger des recherches ! L’autre point que j’apprécie particulièrement dans la recherche, c’est que l’accomplissement de ce projet de recherche sera d’une grande valeur ajoutée pour les deux domaines scientifiques. D’une part, ce travail permettra de créer des ressources linguistiques et une base de connaissance, élargissant la capacité des modèles de TAL à traiter et analyser des documents astrophysiques. D’autre part, les méthodes développées permettront à la communauté astrophysique d’accéder en temps réel aux informations essentielles, ce qui contribuera à élargir le champ de connaissances disponible lié en particulier à l’univers en améliorant le travail de la communauté astrophysique.
Que dirais-tu à un IPSAlien intéressé lui-aussi par la recherche ?
La première chose que j’ai à lui dire, c’est que la recherche va venir l’enrichir intellectuellement. La deuxième, c’est que son travail de chercheur contribuera à quelque chose de plus grand. La troisième, c’est que pour vraiment se lancer dans des études doctorales, il doit d’abord trouver un domaine, une problématique, une question bien particulière qui le passionne pour ensuite axer ses recherches dessus. Enfin, la quatrième est qu’avant de choisir la recherche, il ne doit surtout pas hésiter à aller en parler directement à l’IPSA avec nos excellents enseignants-chercheurs : ils m’ont été d’une aide précieuse pour préparer ce doctorat !