Axe Opteam : Optimisation pour les Sciences du Vivant

Les problèmes d’optimisation rencontrés en biologie et en agroécologie sont nombreux et variés. Ils font souvent appel à des objets discrets tels que la séquence, la composition en acides aminés des protéines, la structure des réseaux de régulations, l’assolement des cultures, …

Ces problèmes deviennent fortement combinatoires dès que leur taille augmente. L’optimisation combinatoire est une discipline qui vise à exprimer dans divers formalismes ce type de problèmes pour ensuite mieux les résoudre.

L’axe « Optimisation pour les Sciences du Vivant » développe des méthodes d’optimisation à variables continues ou discrètes, principalement dans le formalisme des réseaux de fonctions de coûts SchiexIJCAI1995 au sein du cadre des modèles graphiques déterministes et probabilistes (champ de Markov, réseau Bayésien).

Cela s’inscrit dans le Grand Objectif Scientifique GOS3 (concevoir, décider) et dans le Champ Thématique CT5 (recherche opérationnelle) du schéma stratégique du département MATHNUM.

Les thématiques principales abordées dans l’axe sont :

  • L’efficacité des méthodes d’optimisation (gains en temps et en espace mémoire) permettant de résoudre plus efficacement des problèmes de grande taille.
  • L’hybridation des méthodes d’optimisation et d’apprentissage automatique. Il peut s’agir d’utiliser l’apprentissage pour améliorer, comme nous l’avons précédemment fait, l’efficacité de méthodes d’optimisation ou bien pour aider à modéliser un problème.
  • L’expressivité du formalisme de représentation des problèmes et des requêtes pouvant être traitées (optimisation, comptage, énumération,..).
  • Les applications dans les sciences du vivant.

Thématique Efficacité

Concernant l’efficacité des méthodes, une source d’amélioration potentielle provient du transfert et de l’hybridation de techniques issues de la programmation mathématique, dont l’optimisation convexe, qui produit de meilleures bornes que nos approches actuelles (demandes de postes CR sur le sujet dans l’équipe SaAB en 2024 et 2025), de la programmation par contraintes et de la logique propositionnelle. L’efficacité algorithmique est aussi un thème présent dans l’axe « Biologie computationnelle », pour le traitement efficace des séquences et graphes de pangénomes (voir theme Algorithmique des génomes de l’axe BioComp).

L’informatique quantique est une autre piste de recherche exploratoire intéressante pour l’optimisation (voir, à Toulouse, l’Institute for Quantum Technologies in Occitanie). Enfin, l’accélération matérielle par carte graphique (GPU) est une autre voie d’amélioration à plus court terme actuellement abordée dans l’axe.

Thématique Hybridation

Sur le sujet de l’hybridation avec l’apprentissage automatique, et en lien avec l’axe « Statistique et machine learning » (voir thème Apprentissage par réseaux de neurones de l’axe ASAP) et avec l’arrivée d’un CR dans l’équipe SaAB en janvier 2025, nous étudierons le réglage automatique des paramètres d’un solveur, l’apprentissage des réseaux de fonctions de coûts d’arité non-binaire et l’hybridation avec des méthodes d’apprentissage profond pour guider le solveur (heuristiques sur la propagation et le branchement dans les méthodes arborescentes). Ces travaux seront effectués au sein de deux projets (ANR « GMLaS » 2024-2029 et chaire industrielle ANITI2 « HEROIC » 2024-2028) qui vont financer deux thèses et deux post-doctorats. À plus long terme, nous souhaitons contribuer à l’IA neuro-symbolique en proposant un framework de développement de méthodes hybrides d’apprentissage profond et d’optimisation combinatoire. Nous nous intéressons également aux travaux de la communauté toulousaine sur l’optimisation continue pour l’apprentissage profond.

Thématique Expressivité

Pour augmenter l’expressivité des réseaux de fonctions de coûts, nous travaillons sur la propagation de contraintes globales (contrainte de permutation) et envisageons d’étudier d’autres contraintes (contrainte disjonctive, contrainte cumulative) présentes dans les problèmes d’ordonnancement en lien avec la chaire « HEROIC » (chaîne d’assemblage à Airbus, à Liebherr, ordonnancement de patients à l’Oncopole) et aussi d’intérêt en agroécologie. Concernant les requêtes, l’optimisation multi-critères motivée par des besoins en design de protéines et en génomique, la prise en compte de l’incertitude dans les problèmes d’ordonnancement (durée des tâches incertaine, optimisation robuste), l’inférence de modèles graphiques probabilistes orientés, le calcul de la fonction de partition, l’optimisation bi-niveau et l’explicabilité des raisonnements dans les réseaux de fonctions de coûts (projet européen soumis à Novo Nordisk sur la vérification de solveurs) sont d’autres sujets sur lesquels nous devrions poursuivre nos travaux.

Applications

Nos applications portent actuellement sur le design computationnel de protéines et l’aide à l’assemblage de génomes. Par le passé, des applications en génétique (correction d’erreurs mendéliennes, reconstruction d’haplotypes) et agroécologie (design de vergers-maraîchers, planification de cultures) ont été abordées, repoussant les limites de l’état de l’art en génétique ou identifiant des verrous méthodologiques (forte complexité des modèles spatio-temporels en agroécologie).

À l’avenir, nous souhaitons poursuivre et renforcer la collaboration avec l’axe « Biologie computationnelle » par le choix de nouvelles applications.

Nos logiciels (toulbar2,tb2_twophase,elsa,rbaryonyx) sont ouverts à la communauté scientifique et accessibles à des non-spécialistes. Nous souhaitons mieux les faire connaître, ainsi que les méthodes existantes d’optimisation, au travers de tutoriaux et formations à destination de nos partenaires dans INRAE et à l’extérieur.




Membres de l’axe

Avatar David Allouche
IR , Mathématiques
Avatar Bessam Azizi
Doctorant(e) , Intelligence Artificielle
Avatar Samuel Buchet
IR , Informatique , CFU
Avatar Benjamin Charlier
CR , Statistique
Avatar Simon de Givry
CR , HDR, informatique
Avatar Gauthier Quesnel
CR , Informatique
Avatar Thomas Schiex
DR , Informatique