La capacité de donner un accès aisé et efficace à des données à une large communauté scientifique est essentielle pour le développement de nombre de recherches scientifiques. La démarche FAIR[1] vise ainsi à gérer les données de façon à ce qu’elles soient « faciles à trouver, accessibles, interopérables et réutilisables ». La Fusion par confinement magnétique a fait récemment un premier pas vers la « FAIRisation » de ses données avec le projet européen FAIR4Fusion[2].
La communauté scientifique européenne dans le domaine de la fusion par confinement magnétique s’est récemment lancée vers la « FAIRisation » des données avec le projet FAIR4Fusion. Ce projet, auquel le CEA-IRFM a participé, développe des recommandations et des prototypes logiciels pour faire évoluer la gestion des données de la communauté fusion européenne vers des pratiques « FAIR ». Historiquement, chaque laboratoire de fusion en Europe gère les données de ses dispositifs expérimentaux de façon indépendante et non interopérable. Il n’y a pas de catalogue de données centralisé, et chaque laboratoire a sa propre terminologie pour les données physiques et ses propres méthodes d’accès. Il est donc très difficile de faire des recherches portant sur plusieurs tokamaks simultanément, ce qui est un obstacle pour exploiter tout le potentiel des expériences fusion européennes.
Les recommandations du projet FAIR4Fusion portent sur quatre aspects :
- Déployer un catalogue centralisé rassemblant les métadonnées de toutes les expériences fusion européennes. Ces données sont rendues interopérables par l’utilisation du standard de données fusion « IMAS[3] » développé par ITER Organization
- Rendre possible l’accès aux données complètes des expériences via les sélections réalisées sur ce catalogue
- Rendre les données réutilisables en documentant mieux leur provenance, leur cycle de vie, en leur associant un identifiant unique et persistant, et en donnant la possibilité de les annoter et d’établir des liens avec les publications qui les utilisent
- Rendre à terme, les données accessibles à tous, dans l’esprit de la Science Ouverte.
Le catalogue de données développé par le projet FAIR4Fusion a été déployé sur le tokamak WEST et permet désormais d’effectuer des recherches multicritères sur les métadonnées physiques caractérisant les expériences. Le déploiement du catalogue a été facilité par le fait que WEST utilise déjà le standard IMAS pour ses données traitées. Le catalogue a été rempli avec les données de campagnes expérimentales passées. Il sera maintenant systématiquement alimenté après chaque nouvelle décharge plasma de WEST. Les données sont traitées de façon identique et automatisée pour toutes les décharges, et un effort particulier a été fait pour documenter leur origine (données brutes et méthode de traitement utilisées).
WEST est pionnier dans l’usage de ce catalogue, qui va être déployé par le consortium EUROfusion en 2023 comme un service centralisé rassemblant les métadonnées de l’ensemble des expériences fusion européennes. Cette démarche permettra d’exploiter de façon beaucoup plus riche et systématique l’ensemble des résultats expérimentaux européens et facilitera notamment la confrontation à l’expérience des modèles et outils de simulation européens.

———————————————————–
[2] https://www.fair4fusion.eu/
[3] F. Imbeaux, S.D. Pinches, J.B. Lister et al, Design and first applications of the ITER integrated modelling & analysis suite, Nucl. Fusion 55 (2015) 123006, doi:10.1088/0029-5515/55/12/123006, https://hal.archives-ouvertes.fr/DSM-IRFM/cea-01576460