L’astronomie montre l’exemple en matière de science ouverte : l’étude de notre univers repose, depuis de nombreuses années, sur des données publiques, des logiciels libres et une logique de collaboration internationale. L’un des fleurons en la matière se trouve à Strasbourg : le Centre de données astronomiques de Strasbourg (CDS)* créé en 1972.
« Dès sa création, les missions du centre étaient de collecter les informations sur les objets astronomiques et les partager. Pas uniquement avec la communauté française mais avec l’ensemble de la communauté mondiale », relate Sébastien Derrière, astronome adjoint. Inchangées depuis, ces missions consistent à collecter des données astronomiques sous forme informatisée ; les vérifier, les compléter et les lier à des publications scientifiques ; les distribuer à la communauté astronomique et enfin mener des recherches. Ce modèle est l’illustration même des notions de données ouvertes, l’open data, et de science ouverte et collaborative, la fameuse open science.
Le CDS constitue un authentique précurseur sur ces questions qui font l’actualité de la recherche presque cinquante ans plus tard. Une petite prouesse alors que les réseaux de communication et les capacités de traitement informatique à l’époque de sa fondation étaient à des années lumières de celles qu’on connaît aujourd’hui.
« On compte un million de requêtes par jour sur nos serveurs, provenant de tous les pays du monde. »
Pour poursuivre ses missions pendant plus de quatre décennies, le centre s’est continuellement adapté aux évolutions technologiques. « À l’origine, les données étaient enregistrées sur cartes perforées, occupaient des armoires entières et étaient traitées par un ordinateur central », rappelle Sébastien Derrière. Aujourd’hui, le CDS propose l’ensemble de ses ressources sur le web, accessibles gratuitement en quelques clics. « On compte un million de requêtes par jour sur nos serveurs, provenant de tous les pays du monde. Nos outils sont utilisés 24h/24 ! », s’enthousiasme-t-il.
Le centre compte une trentaine de membres : des chercheurs en astronomie, des documentalistes et des ingénieurs en informatique. « Ces trois profils travaillent en symbiose : les documentalistes répertorient les publications sur les objets astronomiques et alimentent les bases de données qui sont utilisées par les chercheurs. Les ingénieurs mettent au point les logiciels qui permettent d’accéder à ces données et leur apportent les fonctionnalités utiles aux scientifiques. »
La communauté astronomique peut se féliciter d’avoir toujours été à la pointe du partage de données scientifiques. Dès 1993, certaines revues scientifiques à comité de lecture comme Astronomy & Astrophysics ont permis de déposer les données électroniques associées aux articles dans la base VizieR, gérée par le CDS. « Imprimer des pages et des pages de relevés n’avait pas un grand intérêt pour les revues mais par contre les mettre à disposition sous forme numérique permettait à toute la communauté de les vérifier et de s’en servir. » Ce principe a permis d’alimenter continuellement VizieR ainsi que Simbad qui, fort de plus de 10 millions d’enregistrements, a acquis le statut de référence mondiale pour l’identification des objets astronomiques.
Les données récoltées sont confiées pendant un an aux scientifiques commanditaires des observations pour qu’ils mènent à bien leurs analyses et conclusions puis sont automatiquement rendues publiques
L’utilisation de grands outils d’observation comme le satellite Hubble ou les télescopes terrestres d’envergure fonctionne sur un principe assez similaire. Les données récoltées sont confiées pendant un an aux scientifiques commanditaires des observations pour qu’ils mènent à bien leurs analyses et conclusions puis sont automatiquement rendues publiques pour que l’ensemble de la communauté en bénéficie. « Ce système permet de doubler le nombre de publications scientifiques à partir des observations menées sur ces appareils. C’est un moyen d’en répartir les frais de fonctionnement et de maximiser le retour sur investissement. C’est un argument non négligeable auprès des financeurs comme l’Union européenne », observe Sébastien Derrière.
La suite logique de ces initiatives successives réside dans la constitution d’un réseau d’organismes astronomiques du monde entier, l'International Virtuel Observatory Alliance (IVOA). Fort de son expérience en matière de science ouverte, le CDS y participe activement, contribuant notamment à définir des protocoles et standards informatiques qui permettent de partager les données entre ses membres. Une nouvelle étape pour mettre au point un observatoire virtuel à l’échelle planétaire. Les astronomes ont la tête dans les étoiles mais ils ont aussi les pieds sur terre…
* Unité mixte de recherche Unistra – CNRS (UMR 7550)
La base de données des objets astronomiques Simbad a été créée en 1981. Elle compte plus de 10 millions d’enregistrements. Elle est alimentée par les documentalistes du centre, sur la base des publications scientifiques qu’ils recensent.
VizieR est une bibliothèque qui recense plus de 19 000 catalogues astronomiques. Le plus grand et le plus célèbre catalogue, ajouté au mois d’avril 2018, contient 1,7 milliard de sources mesurées par le satellite Gaia.
Aladin est un logiciel d’accès à 300 collections d’images astronomiques issues de satellites ou télescopes. Il a la particularité de permettre de superposer des données scientifiques sur les images.
Le CDS est aussi l’auteur ou co-auteur de plusieurs technologies informatiques utilisées en astronomie et développées en open source : UCD, MOC, HiPS, etc.