Axe ASAP : Axe Statistique et APprentissage

L’axe ASAP regroupe les activités de l’unité en statistique et apprentissage. Elles se déclinent en quatre thèmes (d’intersections non vides) sur lesquels les membres de l’axe ont une forte expertise : processus stochastiques, modèles graphiques, méthodes à noyaux et apprentissage par réseaux de neurones.

Thématique : Processus stochastiques

Ce terme aborde à la fois de l’étude des propriétés de processus stochastiques, comme par exemple des processus spatiaux et/ou temporels, la proposition de nouveaux cadres de modélisation et le développement d’algorithmes d’inférence pour ces modèles. Nos travaux actuels et à venir se répartissent en deux familles de processus : les modèles de Markov et semi-Markov cachés, d’une part, et les processus gaussiens, d’autre part.

Thématique : Modèles graphiques

Nos travaux dans ce thème relèvent de la statistique computationnelle pour les modèles graphiques à variables discrètes et les modèles graphiques à variables latentes discrètes. Il s’agit de développer des algorithmes efficaces pour le raisonnement dans ces modèles. Cela englobe les tâches d’inférence, de restauration, d’apprentissage de structure et de paramètres dans les modèles graphiques. Un enjeu identifié est le passage à l’échelle des méthodes classiques lorsque les espaces d’états sont trop grands. Nous allons, en particulier, poursuivre l’étude du cas des modèles de Markov cachés multichaines.

Thématique : Méthodes à noyau

Dans ce thème, nos travaux contribuent au développement de méthodes à noyaux pour la prédiction de données structurées et pour l’analyse de formes. Les directions explorées dans ce thème porteront plus particulièrement sur le développement d’approches computationelles pour le passage à l’échelle des méthodes à noyaux, et sur l’amélioration de l’interprétabilité de ces méthodes (en particulier avec une approche de sélection de variables pour les données omiques).

Thématique : Apprentissage par réseaux de neurones

Ancrés depuis longtemps dans le champ de l’apprentissage automatique (machine learning), nos travaux ont également contribué à l’étude et au développement d’approches d’apprentissage profond (deep learning). Nous explorons deux directions singulières. La première concerne l’apprentissage de et pour des données structurées. Il s’agit en particulier de données sous forme de graphe (par réseaux de neurones pour graphes). La seconde concerne le développement de méthodes et architectures, basées sur des grands modèles de language, pour l’analyse de données génétiques et génomique.

Applications

Enfin, les travaux des quatre thèmes sont motivés par et contribuent à des questions finalisées à différentes échelles spatiales : intra moléculaire, individu, population, territoire. Nous sommes impliqué·e·s dans des projets en génétique, design computationel de protéines, écologie, croissance des plantes, ce qui induit, en général, un travail de modélisation statistique de données complexes (données de séquences, d’images, coordonnées atomiques, données temporelles ou spatio-temporelles, données catégorielles ou hybrides, prise en compte de covariables, …).




Membres de l’axe

Avatar David Allouche
IR, Mathématiques
Avatar Céline Brouard
CR, informatique, statistique
Avatar Mathis Campredon
Doctorant(e), Ecologie, Statistique
Avatar Benjamin Charlier
CR, Statistique
Avatar Céline Delmas
CR, Statistique
Avatar Frédérick Garcia
DR, Intelligence Artificielle
Avatar Élise Maigné
IE, Statistique, AP
Avatar Alexis Mergez
Doctorant(e), Intelligence Artificielle, Génomique
Avatar Mimoun Mohamed
Postdoc, informatique
Avatar Raphaël Mourad
MCF, Accueil en délégation, Intelligence artificielle
Avatar Sandra Plancade
CR, Statistique
Avatar Emma Rodriguez
Doctorant(e), Bioinformatique
Avatar Thomas Schiex
DR, Informatique
Avatar Ronan Trépos
IR, Modélication
Avatar Mathieu Valdeyron
Doctorant(e), Statistique
Avatar Nathalie Vialaneix
DR, Statistique, DUA