2023 : Renouvellement de l’infrastructure de calcul et stockage de la plate-forme GenoToul-Bioinfo

La plate-forme GenoToul-Bioinfo procède à la jouvence de son matériel informatique, afin de remplacer la précédente infrastructure qui avait été acquise en 2014 et 2017. La plate-forme se munit donc de 5000 nouveaux cœurs de calcul. Afin de répondre à la demande croissante en mémoire des outils de bio-informatique, la RAM par nœud a été augmentée. Nous avons également acquis une machine spécifique afin de répondre à des calculs nécessitant des besoins très important en mémoire (assemblage de génomes ou métagénomes complexes, pangénomique). Le deep learning étant également de plus en plus utilisée en bio-informatique, nous avons acquis 4 GPU dernière génération, également équipés de beaucoup de mémoire.
Nous avons également investi dans un serveur graphique qui permettra aux utilisateurs de visualiser leurs données (protéines 3D), mais pourra aussi être utilisé pour des usages plus larges, comme l’analyse de données en utilisant les ressources de la plate-forme (Jupyter notebook, Rstudio, bureau virtuel Linux). Enfin, nous avons acquis une infrastructure de stockage optimisée, capable de conserver à la fois des données sur le temps long, et accessibles rapidement par les calculateurs. Nous prévoyons d’augmenter la ressource en disques en 2024.
Le matériel acquis a été installé sur l’espace mutualisé Clément Ader
Contexte en enjeux
La bio-informatique, et en particulier l’analyse de séquence, est de plus en plus utilisée, par un nombre croissant de laboratoires. Les usages évoluent également : le deep learning est maintenant couramment utilisé, et les lectures longues permettent des assemblages de génomes presque complets, mais demandent également des ressources importantes. Afin de rajeunir son infrastructure vieillissante, et répondre aux nouveaux enjeux, la plate-forme bio-informatique s’est dotée d’une nouvelle solution de stockage et calcul adaptée
Résultats
La plate-forme a acquis 5000 cœurs de calcul, sur 48 nœuds équipés chacun de 2 TO de RAM spécifiques (assemblage de génomes ou métagénomes complexes, pangénomique). Nous avons également acquis un serveur NVidia avec 4 GPU A100, et 80GO, ainsi qu’un serveur graphique de visualisation.
Perspectives
Le nouveau matériel sera plus adapté aux besoins des utilisateurs grâce en particulier à l’augmentation de la RAM (ressource limitante pour plusieurs logiciels de bio-informatique), avec des temps d’attente diminués.
## Valorisation
La plate-forme est remerciée dans plus d’une centaine d’articles scientifiques par an : https://bioinfo.genotoul.fr/index.php/about-us/publications-2-2-2/