Apparue il y a quelques années seulement, la chémographie – une branche de la chémoinformatique - a pour ambition de cartographier les mille milliards de molécules possibles, appelé l’espace chimique, comme la géographie le fait depuis des siècles pour notre espace physique. Une science naissante qui recourt à l’IA pour découvrir de nouvelles molécules…
La chimie n’échappe pas au mouvement général : la masse de données disponibles est telle que l’être humain ne peut la gérer et a besoin de l’intelligence artificielle. Par exemple, en dix ans, le nombre de composés chimiques enregistrés* a été multiplié par trois, passant de 50 millions à 150 millions de molécules entre 2009 et 2019. La courbe est exponentielle. « Et ces millions de composés ne représentent qu’une petite goutte d’eau dans l’immense univers de structures chimiques possibles. Notre équipe a estimé à 1033 le nombre de molécules organiques à 36 atomes qui pourraient exister », précise Gilles Marcou, enseignant-chercheur au laboratoire de chémoinformatique (UMR Chimie de la matière complexe). Cet ensemble de molécules, réelles ou virtuelles, c’est-à-dire pas encore identifiées ou synthétisées, est appelé espace chimique.
Comment visualiser cette information chimique pour l’explorer et mieux l’exploiter, notamment pour découvrir de nouvelles molécules intéressantes ? Gilles Marcou, Alexandre Varnek et leur équipe développent des méthodes de représentation en 2D ou 3D : la chémographie, néologisme basé sur géographie.
Ils ont développé leur concept à partir de l’algorithme GTM pour Generative Topographic Map, carte topographique générative. Ils ont été parmi les premiers à l’appliquer à la chimie. À partir des bases de données chimiques (ChEMBL, PubChem…), cet algorithme d’intelligence artificielle génère des cartes sur la base des structures chimiques des molécules. Ces cartes permettent de situer des molécules réelles et hypothétiques. Celles qui sont proches chimiquement sont aussi proches spatialement. On peut ainsi repérer des zones intéressantes en faisant l’hypothèse que des molécules proches ont des propriétés similaires. « Ce raisonnement par analogie est très ancien en chimie, le tableau périodique des éléments a été imaginé par Mendeleiev de cette manière » rappelle le chercheur.
Encore très récentes, ces techniques de chémographie ont déjà permis de concevoir de nouvelles structures chimiques, par exemple des électrolytes inédits pour les batteries de prochaine génération, notamment dans les véhicules électriques (projet ANR Devega). Le prochain enjeu pour l’équipe : développer d’autres algorithmes d’IA capables de suggérer de nouvelles structures chimiques positionnées sur les cartes, dans des régions d’intérêt.
* Sur la base de données du Chemical Abstract Service de l‘American Chemical Society qui répertorie les composés chimiques depuis 1907.
Cette science est enseignée dans le master de chémoinformatique qui forme de futurs professionnels pour l’industrie chimique ou pharmaceutique et de futurs chercheurs. Des doubles diplômes internationaux existent avec Milan, Lisbonne, Ljubljana, Kazan, Saint-Pétersbourg et Kiev.
En savoir plus : masterchemoinfo.u-strasbg.fr