Reconnaissance vocale, assistants intelligents, traduction automatique : tous ces outils ont quitté l’univers de la science-fiction pour intégrer notre quotidien. Leur point commun ? Le recours à l’IA pour procéder au traitement automatisé du langage.
« Une intelligence artificielle n’est pas un robot qui tue tout le monde comme on le voit dans les films ! » explique d’emblée Ioana Buhnila, doctorante au sein du laboratoire Linguistique, langues et parole (Lilpa). L’intelligence artificielle permet à une machine d’apprendre en fonction des règles qu’on lui donne, en essayant d’imiter le raisonnement humain. »
Le traitement automatisé du langage fait appel à de nombreux mécanismes pour qu’une machine puisse analyser un texte sous différents angles : syntaxique, grammatical, sémantique… Mais avant toute chose, il faut apprendre à la machine à apprendre une langue : lui indiquer quels en sont les mots, leur nature, leur signification, leurs synonymes, comment les associer... Un véritable travail de fourmi qui bénéficie désormais des progrès technologiques de l’intelligence artificielle et de ses importantes capacités de traitement de données. L’accès à des corpus gigantesques et des algorithmes performants permet de faire du machine learning : laisser la machine apprendre par elle-même à partir des informations et des règles qui lui ont été données.
Avant toute chose, il faut apprendre à la machine à apprendre une langue : lui indiquer les mots, leur nature, leur signification, leurs synonymes...
Par nature, le traitement automatisé du langage est un domaine d’étude interdisciplinaire. Il mêle la linguistique aux mathématiques à l’aide de l’outil informatique. Le cas de Ioana Buhnila en est la parfaite illustration : alors qu’elle a suivi une formation littéraire et qu’elle a appris le français en tant que langue étrangère dans son pays d’origine, la Roumanie, elle doit désormais maîtriser d’autres langages, informatiques cette fois, tels que Python, Perl ou Java, pour manipuler des corpus de langue et en extraire la substantifique moelle.
Son domaine de prédilection est la reformulation automatique. Comment faire pour qu’une machine parvienne à identifier la reformulation d’un terme ? Comment constituer des corpus de paraphrases utilisables par une machine ? Les techniques pour y parvenir s’appuient sur des algorithmes à base d’arbres décisionnels ou des réseaux neuronaux. Sa thèse vise précisément à déterminer quelle méthode ou combinaison de méthodes différentes permet d’obtenir les résultats les plus pertinents.
L’objectif, in fine, est de simplifier automatiquement des textes pour les rendre plus accessibles. Le champ d’application est immense, qu’il s’agisse de documents juridiques, médicaux ou scientifiques. « J’aime les sciences et les faire comprendre. Mon sujet de thèse peut permettre de faciliter l’éducation et le partage des connaissances. »
La problématique de la reformulation est un exemple des difficultés que les chercheurs en intelligence artificielle doivent résoudre pour qu'un jour, une machine puisse parler à l'égal de l'Homme.
Julie, étudiante en troisième année de doctorat en études anglaises et sciences du langage
« Je connais des gens qui travaillent grâce à l’IA. Notamment à l’Observatoire astronomique de Strasbourg, qui l’utilisent pour optimiser leur temps de calcul pour gérer toutes leurs données. Dans mon domaine de recherche, on s’en sert pour analyser plus vite les mots dans un texte. On peut également analyser plus vite des données de type image pour analyser un discours politique, comment la couleur "interagit" avec le texte. »