Entretien avec David Bouvet, responsable technique du projet LCG-France
Cet été David Bouvet a été nommé au poste de responsable technique de LCG France, la partie française de la grille de calcul du grand collisionneur de hadrons (LHC) du CERN. À ce titre il doit coordonner et soutenir la mise à disposition des moyens informatiques français pour le bon fonctionnement de cette grille, la plus grande du monde.
En quoi consiste la fonction de responsable technique LCG-France ?
LCG-France s’occupe de coordonner et de soutenir la mise à disposition des moyens français pour le LHC et fait le relai entre les sites français partenaires. Il y en a neuf. Nous sommes deux pour coordonner LCG-France avec Laurent Duflot du Laboratoire de l’accélérateur linéaire (LAL), qui en est le responsable scientifique. La tâche est conséquente avec beaucoup d’informations à récupérer et à partager avec les sites et la collaboration. Par exemple chaque année, il faut recenser toutes les ressources et demander aux sites de déclarer les moyens qu’ils pourront allouer pour l’année qui vient. De même, chaque expérience exprime chaque année ses besoins en calcul et en espace de stockage de données et sollicite les sites. Par ailleurs, la grille est en perpétuelle évolution et demande une attention continue aussi bien technique qu’opérationnelle.
Quel genre d’évolutions sont nécessaires ?
Il y a par exemple l’ajout de nouvelles fonctionnalités demandées par les physiciens pour faire face à de nouveaux besoins d’analyse, à l’évolution des modèles de calcul des expériences… Ainsi nous procédons régulièrement à des mises à jour. Certaines sont transparentes et se mettent en place sans perturbation. D’autres nécessitent une interruption de service. Dans ce cas il faut qu’elle soit la plus courte possible et, en particulier pour les sites majeurs, effectuée sur le moins de sites à la fois pour que le fonctionnement global ne soit pas affecté.
La grille ne s’interrompt donc jamais ?
Non. Une majeure partie des données existent en plusieurs exemplaires et la capacité de calcul reste suffisante même quand une partie de l’infrastructure est en maintenance. Il faut savoir que la grille ne connaît pas de répit, même lorsque le faisceau du CERN est éteint. Dans ces périodes sans collisions ce sont les simulations, les calculs et les analyses des physiciens qui prennent le relai. La grille est donc en usage permanent et il faut veiller en continu à son bon fonctionnement et à son intégrité.
Devez-vous faire face à des cyberattaques ?
La grille est attaquée quotidiennement notamment pour en détourner les ressources. Une veille est donc assurée par les responsables de la sécurité sur l’ensemble des sites et au niveau de LCG-France aussi. D’autre part, comme pour n’importe quel système informatique, des failles sont trouvées par les développeurs ou les éditeurs de logiciels, ou parfois par les utilisateurs eux-mêmes. Dans ce cas une nouvelle version corrigée est rapidement déployée.
Quels défis attendent la grille pour les années à venir ?
Gérer la grille est déjà un défi permanent car il faut constamment en améliorer les performances sans pour autant que le budget n’évolue. Dans le cas du futur HL-LHC (LHC haute luminosité), le défi va être encore plus grand car les détecteurs du LHC vont produire beaucoup plus de données et qu’il faudra les conserver en totalité, alors qu’à l’heure actuelle seuls les événements signifiants sont enregistrés. Il faudra donc une adaptation conséquente de la grille et cela va passer par une anticipation des besoins. La question du budget sera importante, mais il faudra aussi trouver une réponse technique au défi, et enfin qu’il y ait suffisamment de temps pour sa mise en place.
David Bouvet est titulaire d’une thèse en physique des particules depuis 2001 consacrée au développement du trajectographe de l’expérience CMS (Compact muons solenoid) ainsi que d’une partie de son programme de reconstruction. Il intègre le centre de calcul de l’IN2P3 (CC-IN2P3) en 2004 pour faire du support aux expériences dans la mise en place de la grille de calcul du LHC. Il est alors la charnière entre les physiciens et les informaticiens. Depuis 6 ans il était responsable de l’équipe support utilisateurs au CC, avant d’être nommé en juillet dernier au poste de responsable technique LCG-France.
Cap sur le L2IT
Après 5 années passées à assurer la coordination technique de LCG France, de 2014 à 2019, Catherine Biscarat cède sa place à David Bouvet. Cette physicienne passée par les collaborations ATLAS et Dzero, a très tôt concilié la recherche en physique des particules et l’informatique. Forte de cette double culture elle est la première physicienne de l’institut à intégrer le CC-IN2P3 qui s’ouvrait alors à des profils mixtes de « physico-informaticiens ». En 4 ans de séjour, elle y acquiert une véritable expertise des infrastructures de calcul qu’elle mettra ensuite à profit en rejoignant le service informatique du LPSC et en prenant la coordination technique de LCG-France. Son chemin de physico-informaticienne l’emmène aujourd’hui à Toulouse où elle intègre l’équipe du tout nouveau laboratoire des 2 infinis de Toulouse (L2IT) créé par l’IN2P3 début septembre. Elle s’y penchera sur les aspects algorithmiques du calcul scientifique, et notamment les méthodes d’analyse innovantes.
La plus grande grille de calcul au monde
WLCG, pour « Worldwide LHC computing grid », est le réseau informatique ou grille de calcul dédié aux expériences du LHC. Distribué à travers le monde entier il gère en temps réel le stockage et les demandes de calcul.
Cette grille, la plus grande au monde, est organisée en 3 niveaux : le niveau Tier-0 au CERN collecte et sauvegarde les données brutes des détecteurs de particules. Les centres de niveau Tier-1, au nombre de 13 et répartis dans le monde, reçoivent les données du CERN, les nettoient et produisent des jeux de données plus petits qui sont sauvegardés sur place et distribués aux centres Tier-2. Ce sont ces données qui sont exploitées par les physiciens du monde entier.
La France s’est engagée à fournir 10% du calcul de WLCG. Le CC-IN2P3, site Tiers-1 situé à Lyon, est la tête de proue de l’infrastructure nationale qui rassemble 8 sites Tiers-2 : CPPM, LPC, Subatech, LPSC, GRIF (Grille au service de la recherche en Ile-de-France), IPHC, IPNL et LAPP.
La grille du LHC en chiffres
- 42 pays impliqués
- 170 centres de calcul connectés
- Plus de 2 million de tâches exécutées chaque jour
- 1 million de cœurs de calcul
- 1 Exabyte de stockage (1 000 000 Terabyte)
- Plus de 10 000 physiciens à l’œuvre autour des expériences du LHC
- Chiffre 2018 du taux de transfert : 35 Gigabits/s échangés