Séminaires : Différence entre versions

De MIAT INRA
Aller à : navigation, rechercher
(01/10/2021 : Titre à venir Raphaël Mourad (IBCG, Université Toulouse 3 & Délégation INRAE MIAT))
 
(368 révisions intermédiaires par 6 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
  
= Séminaires de l'unité MIAT : =
+
= Séminaires de l'unité MIAT =
  
 
[[File:Pyrenees-morning.jpg|thumb|center|800px|Pyrenees-morning.jpg]]
 
[[File:Pyrenees-morning.jpg|thumb|center|800px|Pyrenees-morning.jpg]]
  
Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.
+
Le séminaire de l'équipe MIAT d'INRAe Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.
  
Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué [[Accès_MIAT|ici]] (nous sommes à moins de 30 mètres de la réception&nbsp;!). <!--The seminar of the MIAT Unit of the INRA in Toulouse is a place for scientific and technical exchanges between members of the unit and experts in mathematics, computer science,&#160;agro-ecosystems, bioinformatics ''etc.'' Talks can be on mature ongoing working subjects, on finalized highly specialized projects or have a more informative/educational scope. The focus can be on methodological aspects as well as on applications. Some presentations during other local seminars can be flagged as highly interesting to the usual audience of the MIAT seminar.
+
Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT d'INRAe Auzeville/Castanet est indiqué [[Accès_MIAT|ici]] (nous sommes à moins de 30 mètres de la réception&nbsp;!).  
Presentations can be either in English or in French. According to the presentation, a typical seminar lasts from 45min to a couple of hours. Unless otherwise stated, it is held in the MIAT meeting room at 10.30 on Fridays. Acces to the INRA Auzeville/Castanet, MIAT unit is indicated [[Accès_MIAT|here]] (we're less than 30 meters from the reception&#160;!). -->
 
  
&nbsp;
+
== Séminaires de l'année en cours et séminaires futurs ==
  
&nbsp;
+
==== 12/11/2021&nbsp;: ''Titre à venir'' Céline Bougel (visiteuse scientifique IMABS, INRAE) ====
  
&nbsp;
+
==== 29/10/2021 et 05/11/2021&nbsp;: Vacances scolaires - pas de séminaire ====
  
&nbsp;
+
==== 22/10/2021&nbsp;:  ====
  
== Séminaires de l'année en cours et séminaires futurs &nbsp;: ==
+
==== 15/10/2021&nbsp;: Séminaire interne  (SaAB) ====
  
*24/05/2019&nbsp;: ''réservé séminaire IMABS''  
+
==== 08/10/2021&nbsp;: ''Titre à venir'' [https://sites.google.com/site/charpelletier/ Charlotte Pelletier] ====
  
*17/05/2019&nbsp;: ''réservé séminaire IMABS''  
+
==== 01/10/2021&nbsp;: ''Titre à venir'' [https://sites.google.com/site/raphaelmouradeng/ Raphaël Mourad] (IBCG, Université Toulouse 3 & Délégation INRAE MIAT) ====
  
'''Pas de séminaire le 26 avril et le 3 mai (vacances scolaires)'''
+
==== 24/09/2021&nbsp;: Journée « Impact carbone de la recherche et du numérique » dans le cadre des animations IMABS ====
  
*19/04/2019&nbsp;: ''Titre à venir''. [https://sites.google.com/view/madalina-olteanu/home Madalina Olteanu] (Panthéon Sorbonne / MaIAGE).
+
==== 17/09/2021&nbsp;: ''Titre à venir'' Amine Ghozlane (Institut Pasteur) ====
  
*12/04/2019&nbsp;: ''Titre à venir''. [https://www6.toulouse.inra.fr/toxalim_eng/Research-Teams/E2-MeX-Metabolism-of-Xenobiotics/Research/Metabolic-Networks Nathalie Poupin] (INRA Toulouse, Toxalim)  
+
==== 10/09/2021&nbsp;: ''Titre à venir'' Paul Terzian (Séminaire interne, plateforme Bioinformatique) ====
  
'''Séminaire [https://www6.inra.fr/imabs/ IMABS]''' (salle de conférence Marc Ridet)&nbsp;:
+
==== 03/09/2021&nbsp;: ''Titre à venir'' [http://genome.jouy.inra.fr/~ltournier/ Laurent Tournier] (INRAE, MaIAGE) ====
  
*29/03/2019&nbsp;: ''Gestion durable des résistances dans les paysages agricoles: la modélisation à la rescousse (?)''. [https://www6.bordeaux-aquitaine.inra.fr/sante-agroecologie-vignoble/Personnel/Scientifiques/Frederic-Fabre Frédéric Fabre] (INRA Bordeaux, SAVE)
+
==== 09/07/2021&nbsp;: ''Journée des stagiaires'' ====
  
:
+
==== 02/07/2021 à 9h15&nbsp;: ''Soutenance de thèse de Gaëlle Lefort'' « Quantification automatique de métabolites dans un spectre RMN et application à la description de la maturité périnatale chez le porc » ====
::'''Résumé&nbsp;:''' Le contournement des résistances des plantes par les agents pathogènes met en jeu de nombreuses forces évolutives qui sont en partie contrôlées génétiquement par les plantes et représentent donc des leviers d’action potentiels pour gérer les maladies. Or, ces forces évolutives interagissent entre elles à différentes échelles de temps et d’espace. Il est donc difficile d’appréhender seulement expérimentalement leurs rôles respectifs afin d’orienter les choix des sélectionneurs lors de la création variétale et des agriculteurs lors du déploiement des variétés. Dans ce contexte, la modélisation constitue un outil intégrateur des connaissances acquises sur les interactions entre les structures paysagères et les dynamiques épidémiologiques et évolutives des agents pathogènes. Différentes approches couplant expérimentations sur l’adaptation des virus aux gènes de résistance des plantes et modélisation seront présentées. A l’échelle des plantes hôtes, des travaux estimant l’importance relative de la mutation, de la sélection et de la dérive génétique lors des dynamiques évolutives des populations virales seront présentées (Rousseau et al., 2017). A l’échelle des paysages, l’expérimentation est particulièrement difficile. Aussi, le rôle de ces forces évolutives dans les étapes impliquées dans le contournement des résistances à cette échelle est étudié essentiellement par modélisation. Des travaux comparant les grandes familles de stratégies de déploiement des gènes de résistance (pyramidage, rotation, mosaïques et mélanges variétaux) vis-à-vis de la durabilité des gènes de résistances et de leur efficacité pour réduire l’impact des épidémies seront présentées (Djidjou-Demasse et al, 2017&nbsp;; Rimbaud et al., 2018a, 2018b).
 
::''Références''&nbsp;: 
 
  
:<ul style="margin-left: 40px;">
+
:'''Résumé'''&nbsp;: Parmi les nombreuses données ''omiques'' qui décrivent le fonctionnement biologique d'un organisme, le métabolome suscite un intérêt croissant car il est plus proche des phénotypes d'intérêt et qu'il a donc avoir un potentiel important pour la recherche de \emph{biomarqueurs}. La spectrométrie par résonance magnétique nucléaire (RMN) est une technologie haut-débit qui produit des spectres caractéristiques du mélange complexe de métabolites présents dans un échantillon d'intérêt. Cependant, leur interprétation biologique est difficile car ceux-ci ne donnent pas une mesure explicite des différentes quantités de métabolites présents dans l'échantillon.
</ul> 
+
:Une approche prometteuse pour l'analyse de ces données consiste à identifier et quantifier les métabolites présents dans le mélange complexe à partir de son spectre et à réaliser l'analyse statistique sur les résultats de cette quantification. Une première partie de cette thèse a consisté en l'amélioration d'une méthode de quantification existante, ASICS, ainsi qu'à son implémentation dans un package R/Bioconductor. Une nouvelle méthode, prenant en compte l'ensemble des spectres d'une expérience lors de la quantification, a aussi été proposée dans le but d'améliorer la fiabilité des résultats.
<ul style="margin-left: 120px;">
+
:Un second volet de cette thèse concerne l'application de cette méthode au problème de mortalité néonatale des porcelets et plus précisément à la description des mécanismes impliqués dans la mise en place de la maturité. L'analyse des spectres RMN de plasma, d'urine et de liquide amniotique de fœtus en fin de gestation a permis d'identifier des voies métaboliques impliquant de nombreux acides aminés et sucres (croissance et apport d'énergie) ainsi que le métabolisme du glutathion (stress oxydatif).
<li>Djidjou-Demasse R, Moury B, Fabre F (2017). Mosaics often outperform pyramids: Insights from a model comparing strategies for the deployment of plant resistance genes against viruses in agricultural landscapes. The New Phytologist 216:239-253.</li>
 
<li>Rousseau E, Moury B, Mailleret L, Senoussi R, Palloix A, Simon V, Valière S, Grognard F, Fabre F. (2017). Estimating virus effective population size and selection without neutral markers. PLoS Pathogens 13:e1006702.</li>
 
<li>Rimbaud, L., Papaïx, J., Rey, J.-F., Barrett, L. G., and Thrall, P. H. (2018a). Assessing the durability and efficiency of landscape-based strategies to deploy plant resistance to pathogens. PLoS Computational Biology 14:e1006067.</li>
 
<li>Rimbaud, L., Papaïx, J., Barrett, L. G., Burdon, J. J., and Thrall, P. H. (2018b). Mosaics, mixtures, rotations or pyramiding: What is the optimal strategy to deploy major gene resistance? Evolutionary Applications 11:1791-1810.</li>
 
</ul>
 
  
*22/03/2019&nbsp;: ''Probing sequence-level instructions for gene expression''. [http://www.igmm.cnrs.fr/en/service/biogenese-micro-arns/ Charles Lecellier] (Institut de Génétique Moléculaire de Montpellier / Institut de Biologie Computationnelle, CNRS).
+
==== 25/06/2021&nbsp;: ''Multi-omics data integration: towards a comprehensive view of cancer'' [https://sites.google.com/view/laura-cantini/home Laura Cantini] (CNRS, IBENS) ====
  
:
+
:'''Résumé'''&nbsp;: Due to the advent of high-throughput technologies, high-dimensional “omics” data are produced at an increasing pace. In cancer biology, national and international consortia have profiled thousands of tumors at multiple molecular levels (“multi-omics”) allowing to gather a comprehensive molecular picture of this disease. Moreover, multi-omics profiling approaches are currently being transposed at single-cell resolution, further increasing the information accessible from cancer samples. The current main challenge is to design appropriate methods to integrate this wealth of information and translate it into actionable biological knowledge.
::'''Résumé&nbsp;:''' Gene expression is orchestrated by distinct regulatory regions to ensure a wide variety of cell types and functions. A challenge is to identify which regulatory regions are active, what are their associated features and how they work together in each cell type. This is all the more warranted as GWAS studies show that the vast majority of the human genome harbors plethora of regulatory elements lying in unannotated regions and their characterization is a necessary step towards the development of medical genomics. In that context, we develop machine learning methods to integrate and interpret diverse types of genomics data, delineate relevant genomic regions and identify novel regulatory elements. I will specifically present our work demonstrating the existence of instructions for gene expression lying at the level of DNA sequence. Our approach positions nucleotide composition as a critical component of gene expression and unveils a strong influence of intronic sequences. We further show that these instructions can be linked to co-regulations associated with genome 3D architecture and to associations of genes within topologically associated domains.  
+
:In this talk, I will discuss two main computational directions for multi-omics integration: (i) multilayer networks to integrate a large range of interactions and (ii) joint dimensionality reduction to extract biological knowledge simultaneously from multiple omics. First, I will present their application on bulk data and then I will discuss our ongoing research in single-cell.
 +
:Selected associated publications & preprints
 +
:Cantini L, Medico E, Fortunato S, Caselle M. Detection of gene communities in multi-networks reveals cancer drivers. Scientific reports. 2015 Dec 7;5(1):1-0.
 +
:Cantini, L., Zakeri, P., Hernandez, C., Naldi, A., Thieffry, D., Remy, E., Baudot, A., 2021. Benchmarking joint multi-omics dimensionality reduction approaches for the study of cancer. Nature Communications 12.
 +
:Kang Y, Thieffry D, Cantini L. Evaluating the reproducibility of single-cell gene regulatory network inference algorithms. Frontiers in genetics. 2021 Mar 22;12:362.
 +
:Huizing GJ, Peyré G, Cantini L. Optimal Transport improves cell-cell similarity inference in single-cell omics data. bioRxiv. 2021 Jan 1.
  
*15/03/2019&nbsp;: ''Titre à venir''. Joon Kwon (MIA Paris).
+
==== 18/06/2021&nbsp;: ''Extensive benchmark of machine learning methods for quantitative microbiome data'' Magali Berland (MetaGenoPolis, INRAE) ====
  
'''Pas de séminaire le 1er et 8 mars (vacances scolaires)'''
+
:'''Résumé'''&nbsp;: Characterization of microbial communities with omics technologies shed to light powerful biomarkers for diagnosis and prognosis in human health. In particular, shotgun metagenomics allows a highly precise microbiome profiling. Indeed, prediction of phenotypic features, such as clinical status or disease states can help to stratify patients which is the first step toward precision medicine. Many machine learning (ML) methods have been developed to tackle classification and regression problems yet statistical specificities of metagenomic data make difficult the learning task. We developed a R workflow designed to compare ML methods for classification or regression from the caret package. The Activeon Proactive engine was used to efficiently distribute the computing load on multiple servers. We then applied our workflow on a dataset where the fecal microbiota of patients with cardiovascular diseases is compared to healthy controls using shotgun metagenomics.
  
*22/02/2019&nbsp;:&nbsp;''Utilisabilité des indices de végétation MODIS pour la prévision du rendement de la culture de maïs aux Etats Unis''. [https://mia.toulouse.inra.fr/Ronan_TREPOS Ronan Trepos] (MIAT, INRA).
+
==== 11/06/2021&nbsp;: ''Hybrid direct and iterative solvers for the sparse indefinite and overdetermined systems on future exascale architectures'' Philippe Leleux (CERFACS) ====
  
:
+
:'''Résumé&nbsp;:''' In scientific computing, the numerical simulation of systems is crucial to get a deep understanding of the physics underlying real world applications. The models used in simulation are often based on partial differential equations (PDE) which, after fine discretisation, give rise to huge sparse systems of equations to solve. Historically, 2 classes of methods were designed for the solution of such systems: direct methods, robust but expensive in both computations and memory; and iterative methods, cheap but with a very problem-dependent convergence. In the context of high performance computing, hybrid direct-iterative methods were then introduced in order to combine the advantages of both methods, while using efficiently the increasingly large and fast supercomputing facilities. In this thesis, we focus on the latter type of methods with two complementary research axes. In a first research track, we detail the mechanisms behind the efficient implementation of multigrid methods. The latter makes use of several levels of increasingly refined grids to solve linear systems with a combination of fine grid smoothing and coarse grid corrections. The efficient parallel implementation of such a scheme is a difficult task. We then focus on the improvement of the parallel efficiency of a multigrid scheme and in particular the scalability of the solver used on the coarsest grid. At extreme scale, this study is carried in the HHG framework (Hierarchical Hybrid Grids) for the solution of a Stokes problem with jumping coefficients, inspired from Earth's mantle convection simulation.
::'''Résumé&nbsp;:''' La télédétection permet de fournir en routine des indices de végétation&nbsp; calculés à partir de la réfléctance des couverts végétaux. L'étude des séries temporelles de ces indices&nbsp; peut être une façon d'évaluer le niveau de production des culture et ses impacts. En parallèle, les modèles de culture (STICS,&nbsp; DSSAT, ...) simulent la dynamique des cultures en considérant un&nbsp; peuplement homogène sur une surface donnée (parcelle, placette). Les entrées et paramètres de&nbsp; ces modèles sont nombreux et difficiles a acquérir ou estimer, et impactent fortement la simulation. Les indices de végétation issus de la&nbsp; télédétection sont donc souvent utilisés pour recalibrer les modèles, ou alors ils sont assimilés pour corriger&nbsp; les trajectoires des variables simulées. Dans le cadre d'un projet visant ce type de couplage entre les indices&nbsp; de végétation et les modèles de culture, je vais présenter une étude préliminaire sur l'utilisabilité des indices&nbsp; de végétation MODIS pour la prévision du rendement du maïs aux Etats Unis.  
+
:In the following chapters, we study some hybrid methods derived from the classical row-projection method block Cimmino, and interpreted as domain decomposition methods. These methods are based on the partitioning of the matrix into blocks of rows on which projections are computed to iteratively approximate the solution of a linear system. Both methods are implemented in the parallel solver ABCD-Solver (Augmented Block Cimmino Distributed solver). Finally, for the solution of discretized PDE problems, we propose a new approach using a coarse representation of the space to obtain an iterative method with fast linear convergence, demonstrated on Helmholtz and Convection-Diffusion problems.
  
*15/02/2019&nbsp;: ''Au-delà des conteneurs&nbsp;: Environnements logiciels reproductibles avec GNU Guix''. [http://people.bordeaux.inria.fr/lcourtes/ Ludovic Courtès] (INRIA Bordeaux, SED). [https://mia.toulouse.inra.fr/images/2/2d/Seminaire_ludovic_courtes.pdf Diaporama]
+
==== 04/06/2021&nbsp;: ''Hidden semi-Markov models : inference, control and applications'' Nathalie Peyrard (Séminaire interne, équipe SciDyn) ====
  
:
+
:''Résumé''&nbsp;: Le cadre HSMM est une extension du cadre HMM, où les durées de séjour dans les états cachés sont modélisées explicitement.
::'''Résumé&nbsp;:''' La reproductibilité des expériences impliquant du logiciel est un enjeu scientifique majeur. Docker et Singularity peuvent répliquer un environnement logiciel mais permettent difficilement d’aller au-delà et d’expérimenter. Peut on concilier reproductibilité et expérimentation pour les environnements logiciels&nbsp;? GNU&nbsp;Guix est comparable à apt-get, yum ou CONDA, mais il fournit des binaires reproductibles et un suivi de leur provenance. Il peut aider à la gestion d’environnements comme VirtualEnv ou encore provisionner des conteneurs. J’évoquerai notre expérience avec Guix en calcul intensif (HPC) et son positionnement par rapport à des outils comme Singularity ou EasyBuild. Enfin j'expliquerai comment nous cherchons à intégrer la notion de déploiement au cœur d’applications telles que Jupyter ou les outils de gestion de pipelines. Liens&nbsp;: [https://guix-hpc.bordeaux.inria.fr/ https://guix-hpc.bordeaux.inria.fr/] et [https://gnu.org/s/guix https://gnu.org/s/guix] 
+
:Je présenterai  les travaux en cours dans SCIDyn sur le thème de l'inférence dans les HSMM avec des applications en croissance des plantes et en inférence de chemins migratoires chez les oiseaux, ainsi que le projet HSMM-INCA soumis cette année à l'ANR.
  
*8/02/2019&nbsp;:&nbsp;''Approaches for predicting phenotypic plasticity of agronomical traits''. [https://www6.toulouse.inra.fr/agir/Les-equipes/VASCO/Membres/Pierre-Casadebaig Pierre Casadebaig] (UMR AGIR, INRA Toulouse).
+
==== 28/05/2021&nbsp;: ''Optimisation agronomique par simulation et intelligence artificielle: application à la conduite de systèmes agroforestiers'' Antoine Labatie  ====
  
:
+
:'''Résumé'''&nbsp;: L'avènement récent du "deep learning" a permis des avancées majeures dans de multiples domaines applicatifs : robotique, voitures autonomes, imagerie médicale, traitement du langage, jeu de go, etc. L'un des éléments ayant permis toutes ces avancées est l'utilisation de grandes quantités de données pour l'entraînement des modèles. Lorsque ces grandes quantités de données ne peuvent pas être obtenues en conditions réelles, des simulateurs sont souvent utilisés comme "générateurs" de données proches des conditions réelles. Il semble prometteur d'utiliser cette approche en agronomie compte tenu d'une part de la difficulté fréquente d'acquisition de données réelles, et d'autre part de la préexistence de simulateurs agronomiques.
::'''Résumé&nbsp;:''' Ce séminaire présente deux approches numériques pour prédire des traits complexes agronomiques dans une diversité d'environnements. Un premier cas d'étude considère que l'on dispose d'informations sur le génotype des variétés étudiées et propose des approches de modélisation adaptées (gene-based models, whole genome prediction models). Ce cas d'étude sera illustré par quelques exemples avec la culture de tournesol. Dans un second cas d'étude, nous disposons de moins d'informations sur la plante et présenterons une approche de modélisation basée sur les traits fonctionnels. Nous illustrerons cette approche avec un récent projet de recherche sur les cultures associées (mélange de deux espèces dans un même champ).  
+
:Cette présentation exposera le travail récent que j'ai effectué en suivant cette approche. Ce travail, qui est effectué en collaboration avec l'équipe développant le simulateur Hi-sAFe à l'INRAE (UMR System), vise à l'optimisation de la conduite de systèmes agroforestiers. Je présenterai d'abord les algorithmes standards d'IA utilisés pour résoudre ce type de problème d'optimisation. Je présenterai ensuite les adaptations de ces algorithmes qui ont dû être faites dans ce contexte précis pour améliorer la performance finale. Je présenterai enfin quelques résultats concrets et leurs possibles interprétations.
  
*<span style="text-justify:inter-ideograph">1/02/2019&nbsp;:&nbsp;''Sociétés rurales du passé et du présent&nbsp;: Une approche par Modélisation sociale multi-agents spatialisée''. Medhi Saqalli (UMR GEODE, CNRS). . [https://mia.toulouse.inra.fr/images/0/07/Séminaire_MIAT_Saqalli.pdf diaporama].</span>
+
==== 21/05/2021&nbsp;: ''Classer la migration à l'ère du Big Data. Est-il possible d'identifier le comportement de migration par des routines automatiques ? Performance de 3 méthodes, MigrO, MigrateR et une approche de segmentation'' [https://www6.toulouse.inrae.fr/cefs/PERSONNELS/Permanents/Debeffe-Lucie Lucie Debeffe] (INRAE, CEFS) ====
  
:
+
:'''Résumé'''&nbsp;: Migration remains a complex phenomenon, and previous work has shown the potential inconsistencies in the classification of movement. Here we aimed at evaluating the criticalities in the uninformed, automatic identification of ungulate migration with a test-case. Specifically, we first evaluate the robustness of different routines applied to the same datasets; and second, disentangle how the robustness of classification is affected by the routine applied, or, conversely, by the definition of the biological phenomenon that is then used to parametrise such routines. A dataset of 261 trajectories from 21 populations of one species distributed at the continental scale (red deer from Euromammals/Euroredeer database: euroreddeer.org) was used. We classified each trajectory into migratory and non-migratory (resident and dispersal) movements with three unsupervised procedures that rely on spatio-temporal definition of seasonal ranges. Further, we compared the automatic classification output with visual classification from ecologists and wildlife biologists with a different degree of knowledge of migratory behaviour and red deer populations. By doing this, we aimed to specifically evaluate the consistency in identification of migration.
::'''Résumé&nbsp;:''' Cette présentation traite de la démarche élaborée pour la reconstitution des socio-écosystèmes au sens de Elinor Ostrom, à savoir la combinaison populations et règles sociales d’une part, territoire et environnement d’autre part, qui interagissent par l’intermédiaire des aménités et services écosystémiques qui les relient et en particulier via les systèmes agraires.&nbsp;<span style="text-align: justify">Nous présentons plusieurs exemples d’application actuels (dynamiques sociales, modes d’organisation familiale et héritages au Sahel nigérien&nbsp;; contamination pétrolière et colonisation de l’Amazonie équatorienne) et passés (populations et systèmes agraires de la culture rubanée sur les 1000 ans entourant l’expansion et la disparition finale de cette culture sur l’Europe tempérée).&nbsp;</span><span style="text-align: justify">La construction de ces modélisations multi-agents spatialisées passe par la formalisation des paramètres environnementaux et agro-zootechniques mais aussi des règles socio-anthropologiques et économiques qui, fonctionnant et s’adaptant aux mailles les plus petites, sociales (la famille et l’individu), temporelle (la saison, le mois voire la semaine) et spatiale (l’hectare le plus souvent) et évoluant selon les conditions du milieu local (écologie, dynamique passée, démographie) permettent de reconstituer des dynamiques sociales et spatiales passées mais aussi, pour l’actuel, d’envisager une exploration de la résilience des systèmes et de la prospective sur leurs futurs, au travers de scénarios dont la légitimité est toujours à formaliser collectivement.</span> 
 
  
*<span style="text-justify:inter-ideograph">25/01/2019&nbsp;: ''Développements récents et ouvertures pour la détection de segments atypiques au sein de séquences''. [https://perso.math.univ-toulouse.fr/mercier/ Sabine Mercier] (UT2J, IMT).</span>
+
==== 14/05/2021&nbsp; Pont de l'ascension (pas de séminaire) ====
  
:
+
==== 07/05/2021&nbsp;: ''SIWAA, le site web Galaxy pour la simulation et l'analyse mathématique des agroécosystèmes'' Patrick Chabrier (équipe RECORD, séminaire interne) [https://miat.inrae.fr/site/images/4/42/Chabrier.pdf diaporama] ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Nous commencerons par définir le score local et présenter le contexte historique des travaux théoriques sur sa distribution. Deux résultats récents seront ensuite développés. Une approximation asymptotique de la loi du score local pour une chaîne de Markov, améliorant les résultats de Karlin et Dembo de 1992 ''passés sous silence'', sera tout d'abord présentée. Nous proposons ensuite de probabiliser l'espace de tous les segments possibles, optimaux et sous optimaux, sans se limiter aux segments réalisant le score local&nbsp;; de mettre cet espace en relation avec celui provenant naturellement de l'utilisation des chaînes de Markov cachées. Cette dualité permet alors un transfert de compétences pour la détection de segments atypiques. Les ouvertures prometteuses de ces travaux, ainsi que les résultats sur le score local de manière générale, seront abordées&nbsp;: application en Maîtrise statistique des Procédés&nbsp;; inférence sur le score local&nbsp;; approximation du nombre de régions de scores dépassant un seuil donné&nbsp;; test multiple...</span> 
 
  
*<span style="text-justify:inter-ideograph">18/01/2019&nbsp;: ''Classification des essences arborées à partir de séries temporelles d'images satellitaires''. [http://www.ensat.fr/fr/formations/les-enseignants/david-sheeren.html David Sheeren] (ENSAT, Toulouse).</span>
+
:'''Résumé'''&nbsp;: L'équipe RECORD administre et développe le site web SIWAA pour l'analyse et la simulation de modèles dans le périmètre des agroécosystèmes. Ce site web repose sur le framework Galaxy qui est déployé à la fois sur des ressources informatiques INRAE et sur le mésocentre de l'université de Montpellier. Nous présentons à la fois les motivations et les grandes lignes de l'architecture de ce site Web pour fournir un retour d'expérience à la fois technique et organisationnel sur le fonctionnement du système en place. On aborde aussi la question du processus de développement informatique visant à ajouter des outils sur le site web, mobilisant en particulier des services de la forge MIA.
  
:
+
==== 23/04/2021 et 30/04/2021 &nbsp;: Pas de séminaire (vacances scolaires) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La connaissance précise de la localisation des peuplements forestiers et&nbsp;leur composition en essences est une donnée incontournable pour les&nbsp; gestionnaires réalisant des opérations sylvicoles. C’est aussi un&nbsp;préalable indispensable pour étudier la réponse des forêts au changement&nbsp;climatique et prédire la répartition potentielle des essences dans le&nbsp;futur. Dans cet exposé, je montrerai le potentiel qu'offre les séries&nbsp; temporelles d'images optiques à haute résolution spatiale pour&nbsp;discriminer automatiquement les essences dominantes dans des forêts de&nbsp;feuillus et conifères. Après une présentation des données et de la&nbsp;démarche méthodologique adoptée faisant appel à des techniques&nbsp;d'apprentissage statistique, je décrirai les résultats obtenus sur 9&nbsp;années à partir de séries Formosat-2, leur stabilité inter-annuelle, et&nbsp;l'impact de la prise en compte de l'auto-corrélation spatiale des&nbsp;échantillons sur la performance des modèles. Dans un second temps, un&nbsp;travail spécifique sur la détection de peupleraies avec des données Sentinel-2 sera évoqué, en montrant l'intérêt de l'apprentissage actif&nbsp;pour adapter progressivement le modèle et le rendre exploitable à large échelle.&nbsp;</span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">11/01/2019&nbsp;:&nbsp;''Argumentation Reasoning''.&nbsp;[https://www.irit.fr/~Sylvie.Doutre/ Sylvie Doutre](Université Toulouse 1, UMR IRIT). [https://mia.toulouse.inra.fr/images/1/1d/INRA_MIAT_SeminaireArgumentation_Doutre2019.pdf diaporama]</span></span>
+
==== 16/04/2021&nbsp;: ''Optimal convergence rates for Nesterov acceleration.'' [https://perso.math.univ-toulouse.fr/rondepierre/ Aude Rondepierre] (INSA/IMT) [https://miat.inrae.fr/site/images/0/0b/Rondepierre.pdf diaporama]====
  
:
+
:'''Résumé&nbsp;:''' In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Abstract argumentation is an elegant way to tackle reasoning problems in presence of conflicting information. This reasoning model finds applications in various domains such as medicine, law, or agriculture. The seminal paper by Dung defines an argumentation framework as a digraph whose nodes are abstract entities called arguments, and edges are attacks representing the conflicts between these arguments. Several acceptability semantics allow to decide which sets of arguments are accepted, depending on the properties which are expected to be satisfied by a set of arguments to be a rational “outcome” of the framework. Numerous enrichments of Dung’s framework have been proposed, for example, to take into account some supports between arguments besides the attacks, or some preferences between arguments. This talk presents some of these formal frameworks, and addresses a challenging issue that has been addressed in the past few years in this context: the dynamics of abstract argumentation settings</span></span> 
+
:This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Exceptionnellement mardi''' 8/01/2019&nbsp;: ''Une méta-analyse transcriptomique identifie une réponse globale aux stress chez la plante modèle Arabidopsis''. [https://www6.inra.fr/mia-paris/Equipes/Membres/Marie-Laure-Martin-Magniette Marie-Laure Martin-Magniette] (MIA Paris & IPS2).</span></span>
+
==== 09/04/2021&nbsp;: ''Properties of the stochastic approximation EM algorithm with mini-batch sampling'' Estelle Kuhn (MaIAGE, INRAE) [https://miat.inrae.fr/site/images/9/9b/Kuhn.pdf diaporama]====
  
:
+
:''Résumé''&nbsp;: To deal with very large datasets a mini-batch version of the Monte Carlo Markov Chain Stochastic Approximation Expectation– Maximization algorithm for general latent variable models is proposed. For exponential models the algorithm is shown to be convergent under classical conditions as the number of iterations increases. Numerical experiments illustrate the performance of the mini-batch algorithm in various models. In particular, we highlight that mini-batch sampling results in an important speed-up of the convergence of the sequence of estimators generated by the algorithm. Moreover, insights on the effect of the mini-batch size on the limit distribution are presented. Finally, we illustrate how to use mini-batch sampling in practice to improve results when a constraint on the computing time is given.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La réponse des plantes aux stress est contrôlée par de nombreux réseaux d’interactions moléculaires. Au niveau transcriptomique, ces réseaux peuvent être explorés par des approches de «&nbsp;coupable par association&nbsp;» pour identifier des modules fonctionnels contrôlant la physiologie de la plante. La quantité des jeux transcriptomiques disponibles dans les bases de données publiques internationales constituent une ressource génomique importante mais leur diversité peut également être considérée comme une limitation pour des méta-analyses car les jeux de données peuvent être très hétérogènes dans leur construction. Pour limiter cet inconvénient, dans notre projet, nous avons considéré presque 400 comparaisons transcriptomiques décrivant des réponses aux stress de la plante modèle Arabidopsis thaliana, toutes produites au cours des 15 dernières années par la plateforme de notre institut avec des protocoles standardisés (Gagnot et al (2008) NAR 36:D986-90). Ces comparaisons ont été divisées en 18 catégories (9 stress biotiques et 9 stress abiotiques) et pour chaque catégorie, nous avons identifié des groupes de gènes co-exprimés à l’aide d’un modèle de mélange gaussien. Au total, 634 groupes de co-expression ont été identifiés et leur annotation a montré de nombreux enrichissements fonctionnels. Tous les résultats par catégorie de stress sont disponibles dans le module GEM2Net ([https://tools.ips2.u-psud.fr/GEM2NET https://tools.ips2.u-psud.fr/GEM2NET]) de la base de données CATdb (Zaag et al (2015) NAR 43:D1010–D1017). Les analyses de co-expression étant faites par catégorie de stress, nous les avons ensuite intégrées pour construire à l’aide de modèle de mélange de graphes un réseau de co-régulation impliquant 2274 gènes regroupés en 43 communautés stables. Une analyse topologique de ce réseau de co-régulation a permis d’identifier 4 grandes fonctions biologiques et une organisation hiérarchique entre ces 4 grandes fonctions qui est la réponse globale aux stress des plantes. L’objectif de cet exposé est de présenter les différentes étapes de ce projet, la méthodologie employée et l’apport de la modélisation statistique.</span></span> 
+
:Joint work with Catherine Matias and Tabea Rebafka
  
<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Pas de séminaire le 28 décembre, ainsi que le 4 janvier (vacances scolaires)'''</span></span>
+
==== 02/04/2021&nbsp;: ''Développements autour de l'assemblage'' Matthias Zytnicki et Andreea Dréau (équipe SAaB, Séminaire interne) [https://miat.inra.fr/site/images/0/08/Presentation_2021_04_02.pdf diaporama] ====
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">21/12/2018 '''exceptionnellement à 14h'''&nbsp;: ''Retour sur ANITI, le projet d'Institut Interdisciplinaire d'Intelligence Artificielle''. [https://mia.toulouse.inra.fr/Frédérick_GARCIA Frédérick Garcia] (MIAT).</span></span>
+
:'''Résumé'''&nbsp;: L'assemblage est le processus, complexe, de reconstruction de génomes. Lors du séminaire d'unité présenté par Clément Birbes, vous avez vu qu'il fait intervenir de nombreuses technologies, apportant chacune une information parcellaire, à assembler de façon à reconstruire l'intégralité du génome, qui dépasse, dans les cas d'intérêts, le milliard de nucléotides (les A, C, G, T du génome). Dans le cadre du projet SeqOccIn, nous vous présenterons les travaux en cours, qui ont pour but d'améliorer les outils d'assemblage. Nous avons travaillé sur deux parties: l'assemblage à partir de 10X, et l'intégration de données d'assemblage. Ces travaux seront présentés, comme il se doit, de façon très pédagogique.
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">14/12/2018&nbsp;: ''Les temps de coalescence pour trois gènes permettent de&nbsp;distinguer entre changement de taille et structure''. [https://www.math.univ-toulouse.fr/~grusea/ Simona Grusea] (INSA Toulouse).</span></span>
+
==== 26/03/2021&nbsp;: ''A novel regularized approach for functional data clustering: an application to milking kinetics in dairy goats'' Christophe Denis (LAMA, Université Paris-Est Marne-la-Vallée) [https://miat.inrae.fr/site/images/a/a1/DDenis.pdf diaporama] ====
  
:
+
:'''Résumé&nbsp;:''' Motivated by an application to the clustering of milking kinetics of dairygoats, we propose in this talk a novel approach for functional data clustering. This issue is of growing interest in precision livestock farming that has been largely based on the development of data acquisition automation and on the development of interpretative tools to capitalize on high-throughput raw data and to generate benchmarks for phenotypic traits. The method that we propose falls in this context. Our methodology relies on a piecewise linear estimation of curves based on a novel regularized change-point estimation method. Our technique is applied to milk emission kinetics data with the aim of a better characterization of inter-animal variability and toward a better understanding of the lactation process.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La quantité croissante de données génomiques actuellement disponibles élargit les horizons de l'inférence en génétique des populations. Un large éventail de méthodes a été publié permettant de détecter et de dater les changements majeurs dans la taille d'une population au cours de l'histoire de l'espèce. En même temps, il est de plus en plus reconnu que la structure d'une population peut générer des données génétiques similaires à celles générées dans les modèles de changement de taille. Récemment, nous avons montré que, quel que soit le modèle de structure de population, il est toujours possible de trouver un modèle panmictique, avec une fonction particulière de changement de taille, ayant une distribution identique de Tk (le premier temps de coalescence pour un échantillon de taille k). Cela implique que l'on ne peut pas distinguer entre un modèle panmictique et un modèle structuré lorsque nous basons notre analyse uniquement sur un seul temps de coalescence. Je présenterai dans cet exposé un travail récent dans lequel, basé sur une étude analytique de la matrice de taux du processus des lignées ancestrales, nous obtenons de nouveaux résultats théoriques sur la distribution jointe des temps de coalescence T3 et T2 pour un échantillon de trois gènes dans une modèle à n îles symétrique. En particulier, nous montrons que cette distribution est toujours différente de celle obtenue dans une population panmictique, quel que soit le scénario de changement de taille de population. La distribution jointe des temps de coalescence (T3, T2) pour un échantillon de trois gènes contient donc suffisamment d'information pour permettre de distinguer entre une population panmictique et un modèle à n îles symétrique.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">07/12/2018&nbsp;: ''Recent algorithmic advances for combinatorial optimization in graphical models''. [http://www7.inra.fr/mia/T/degivry/ Simon de Givry] (MIAT).</span></span>
+
==== 19/03/2021&nbsp;: ''DeepG4: A deep learning model for sequence-driven DNA G4 formation'' Vincent Rocher (CBI, Université Paul Sabatier) ====
  
:
+
:'''Résumé&nbsp;:''' G-Quadruplex (G4) are alternative DNA secondary structures composed of Guanine-rich DNA sequences which can form a four-stranded structure based on a simple strand, and let the second one free. These structures have been found initially on telomeres, but more recent studies found an enrichment of theses structures on promoters of active genes, and suggest an active role in transcription of these genes. Former in-silico methods to detect and study G4 remained mostly on the detection of a specific motif chain, but recent methods have been developed to identify G4 at genome-wide scale using Next Generation sequencing approach, like G4-seq (in-vitro G4) and BG4-seq (in-vivo). Here, we propose a sequence-based computational Deep learning model to predict in-vivo DNA G4 using the DNA sequences of BG4-seq peaks, in order to detect new motifs involved in the G4 prediction. Deep learning is a recent and popular Machine learning set of approaches where model learn features directly from the data, meaning that we could identify de-novo motifs that are related to G4 prediction. This model can be applied to any DNA sequence to predict the G4 formation, and be used in genetics to study the impact of SNP's on the DNA G4 formation propensities.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' By representing the constraints and objective function in fac-torized form, graphical models can concisely define various NP-hard combinatorial optimization problems. They are therefore extensively used in several areas of computer science and artificial intelligence. Graphical models can be deterministic or stochastic, optimize a sum or product of local functions, defining a joint cost or probability distribution. Simple transformations exist between these two types of models, but also with MaxSAT and integer programming. During the past ten years, we have been developing a graphical model solver called toulbar2 and we report on a large comparison of exact solvers which are all state-of-the-art for their own target language. We present recent algorithmic advances in toulbar2 including generalized clique cuts and parallel variable neighborhood search methods that make the solver very competitive on several benchmarks coming from probabilistic inference, computer vision and pattern recognition, weighted MaxSAT, and weighted MaxCSP competitions. Solver toulbar2 is available at [http://www.inra.fr/mia/T/toulbar2 http://www.inra.fr/mia/T/toulbar2].</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">30/11/2018&nbsp;: ''Inférence de traits fonctionnels à partir de données métagénomiques par NMF.'' [http://genome.jouy.inra.fr/~splancade/ Sandra Plancade] (INRA MAIAGE, ISBA Louvain)</span></span>
+
==== 12/03/2021&nbsp;: ''Processus d’assemblage de génomes grâce aux nouvelles technologies de séquençage'' Clément Birbes (plateforme bio-info, Séminaire interne) ====
  
:
+
:'''Résumé&nbsp;:'''Le projet Sequencage Occitanie Innovation (SeqOccIn) a pour but de développer davantage l’expertise bio-informatique et bio-statistique indispensable aux analyses en génomique, une source majeure d’innovation pour la recherche publique et pour les entreprises. Ce projet est divisé en trois niveaux d’études. L’axe 1 pour le génome, connaissance de la variabilité du génome. L’axe 2 pour l’épigénome, l’étude des marques épigénétique de régulation de l’expression du génome. L’axe 3 pour les métagénomes, pour l’analyse fine des communautés au sein d’un métagénome. Ce séminaire sera une « initiation » aux techniques et aux données utilisées pour l’assemblage des génomes mais sera également l’occasion de présenter une partie des travaux réalisés sur l’axe 1 du projet.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La métagénomique étudie le matériel génétique d'un écosystème bactérien, qui désigne l'ensemble des bactéries présentes dans un milieu donné, dans le but de caractériser l'écosystème et les fonctions qui y sont réalisées, ainsi que leur association avec des phénotypes. Dans ce contexte, la NMF (Nonnegative Matrix Factorization), une technique de réduction de dimension sous contraintes de positivité, permet simultanément la comparaison d'échantillons biologiques et l'inférence de structures existantes dans l'écosystème. Dans cet exposé, je présenterai une méthode d'exploration des voies métaboliques associées au processus de digestion des fibres, à partir de mesures métagénomiques dans l'intestin. Cette approche s’appuie sur la construction préalable d’une liste de traits fonctionnels élémentaires caractérisés par un groupe de gènes microbiens, à partir d’une base d’annotation fonctionnelle rassemblant des connaissances biologiques. Une matrice d'abondances en traits fonctionnels pour un ensemble d’individus est alors calculée à partir de mesures métagénomiques. Le modèle biologique considéré suppose l’existence de voies métaboliques caractérisées par une proportion en chacun des traits fonctionnels, et de profils métaboliques individuels définis par une composition en chacune des voies, ce qui correspond à une décomposition NMF. La modélisation est complétés par des contraintes permettant l'inclusion de connaissances biologiques et biochimiques.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">23/11/2018&nbsp;: ''Viability theory and management of sustainability.&nbsp;'' [http://motive.cemagref.fr/people/guillaume.deffuant Guillaume Deffuant] (IRSTEA, LISC)</span></span>
+
==== 05/03/2021 exceptionnellement à 11h&nbsp;: ''Pourquoi et comment réduire les émissions de gaz à effet de serre du secteur de la recherche en France ? L’approche bottom up proposée par Labos 1point5.'' [https://gael.univ-grenoble-alpes.fr/membres/odile-blanchard Odile Blanchard] (GAEL, Université de Grenoble) [https://miat.inrae.fr/site/images/a/ae/Blanchard.pdf diaporama] ====
  
:
+
:'''Résumé&nbsp;:''' La France s’est engagée à la neutralité carbone à l’horizon 2050. Cela signifie que les émissions de gaz à effet de serre de la France doivent diminuer fortement, de façon très rapide, pour atteindre zéro émissions nettes en 2050.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' This talk introduces viability theory and its potential in the management of sustainability. Viability theory addresses the problem of maintaining a dynamical system within a given subset of states, generally called the constraint set. Instead of optimising a criterion, the control strategy thus aims at avoiding crossing the limits of this constraint set. In the case of deterministic dynamics, the main theoretical concept of this theory is the viability kernel. This set includes all states from which there exists a control strategy maintaining the system indefinitely in the constraint set. Different viable control policies can be derived from the viability kernel, which makes this set of high practical interest. The viability kernel has also been used in a mathematical definition of resilience: the resilient states are the ones from which the viability kernel is reachable. Recently, this theory has been completed by other types of sets in a general theory of sustainable management, when making the hypothesis that standard or emergency controls can be applied depending on the situation. The practical application of these theories depends on the algorithms approximating viability kernels and reachable sets, which, unfortunately, face the famous dimensionality curse. The talk finally reports recent progress in improving these algorithms and some remaining challenges.</span></span> 
+
:Le séminaire vise d’une part à discuter pourquoi le secteur de la recherche doit contribuer à la réduction des émissions de gaz à effet de serre de la France et d’autre part à exposer comment le collectif Labos 1point5 s’est emparé de la question depuis 2 ans au sein de la communauté scientifique française.  
 +
:Le séminaire sera l’occasion de présenter le collectif Labos 1point5, ses objectifs, sa structuration, ses travaux. Un temps particulier sera consacré à l’outil d’estimation des émissions de gaz à effet de serre des laboratoires, GES 1point5. Développé par le collectif dans une démarche bottom up, GES 1point5 permet à la fois de définir des plans d’actions pour réduire les émissions de gaz à effet de serre des laboratoires, de mener des expérimentations dans ce domaine dans les laboratoires, et d’engager des travaux de recherche sur l’empreinte carbone de la recherche.
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">16/11/2018&nbsp;: ''How much maths does a biologist need, and vice versa?'' [https://people.csiro.au/R/T/Toni-Reverter-Gomez Toni Reverter-Gomez] (CSIRO, Australie) '''en salle de conférence Marc Ridet'''</span></span>
+
==== 05/03/2021 à 10h&nbsp;: ''Soutenance de thèse de Jelena Vucinic'' : Modélisation moléculaire et Intelligence Artificielle pour le design computationnel de protéines: conception d'enzymes optimisées et de nano-anticorps ====
  
:
+
==== 01/03/2021 à 15h&nbsp;: ''Soutenance de thèse Manon Ruffini'' : Modèles et méthodes pour les problèmes de design de protéines multi-états ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Séminaire [https://www6.inra.fr/imabs/ IMABS]'''</span></span> 
 
  
:
+
==== 19/02/2021 et 26/02/2021&nbsp;: Pas de séminaire (vacances scolaires) ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' “Every new body of discovery is mathematical in form, because there is no other guidance we can have” (Charles Darwin, 1809–1882). Biology is now awash with information, often with gigabytes of molecular data (DNA sequences; RNA expression levels; protein, metabolic, and methylation profiles) for each individual in a study. Hidden within this vast mass of data are hopefully strong signals that can be exploited for novel insight, and the search for such signals goes under a number of different names such as bioinformatics and systems biology. A number of molecular biologists are very proficient in generating such data, but only a handful of researchers have the requisite skills to develop and use the next generation of high dimensional statistics needed to find true associations. From a diametrically opposed side, Mathematicians have devoted enormous efforts to develop quantitative theory of the structure, organization, and dynamics of living systems. Questions such as at what speed should humans change from walking to running? Or how should an individual animal divide its resources, between growth and reproduction, to maximize its fitness? Are illuminated by the powerful methods of optimization theory. With a preference for quantitative genetics and genomics, in this seminar I will offer an opinionated overview of positives, and not so positives synergies between biology and mathematics.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Exceptionnellement mercredi''' 7/11/2018&nbsp;: ''Inference for high-dimensional Poisson regression problems.'' [https://www.ceremade.dauphine.fr/~rivoirar/ Vincent Rivoirard] (Université Paris-Dauphine, CEREMADE).</span></span>
+
==== 12/02/2021&nbsp;: ''A metagenomic-data-based model of the gut microbiota'' Simon Labarthe (INRAE/MaIAGE) ====
  
:
+
:'''Résumé&nbsp;:''' The human gut harbors a complex bacterial community, the gut microbiota, that maintains a symbiotic relationship with its host: the microbiota ecology is then linked to the host’s health. Mathematical models of the microbial population dynamics are therefore a promising tool to study the mechanisms driving the homeostasis or the dysbiosis of the microbiota, and the links with pathologies.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Sparse linear regression problems appear in a variety of settings, but often the noise contaminating observations cannot accurately be described as bounded by or arising from a Gaussian distribution. Poisson observations in particular are a characteristic feature of several real-world applications. Previous work on sparse Poisson regression problems encountered several limiting technical hurdles. This talk describes a novel alternative analysis approach for sparse Poisson inverse problems that (a) sidesteps the technical challenges present in previous work, (b) admits estimators that can readily be computed using off-the-shelf LASSO algorithms, and (c) hints at a general weighted LASSO framework for broad classes of problems. At the heart of this new approach lies a weighted LASSO estimator for which data-dependent weights are based on Poisson concentration inequalities. Unlike previous analyses of the weighted LASSO, the proposed analysis depends on conditions which can be checked or shown to hold in general settings with high probability.</span></span> 
+
:We couple a PDE population dynamics model of functional microbial meta-populations involved in fibre degradation to a fluid mechanic model of the intestinal content. The metabolic capabilities of the meta-populations are inferred from functional metagenomic data through NMF (non-negative matrix factorization). Metabolic models of the meta-populations are built to predict the metabolite consumptions and the growth rates, and are plugged to the PDE population dynamics model to account for the interactions between the bacterial populations and the intestinal environment. Furthermore, the taxonomic composition of the meta-populations is derived from an additional non-negative least square problem regressing taxonomic marker gene counts against the weight matrix resulting from the previous NMF. This approach makes possible direct comparisons between the model outputs and both gene (shotgun) or bacterial (16s) counts.
 +
:''This work is a collaboration with B. Laroche, and with M. Ribot, B. Polizzi, T. Phan and T. Goudon for the population/fluid dynamics model of the microbiota and its environment, and with L. Darrigade and M.Leclerc for the metapopulation construction.''
  
<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Pas de séminaire le 2 novembre (vacances scolaires)'''</span></span>
+
==== 05/02/2021&nbsp;: '''Journée reproductibilité''' dans le cadre des animations IMABS programme à [https://www6.inrae.fr/imabs/Evenements/Seminaires/Journee-Reproductibilite-de-la-Recherche ce lien] ====
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">26/10/2018&nbsp;: ''De la recherche à l'innovation à l'INRA. Exemple du domaine d'Innovation "Agriculture Numérique".'' [https://informatique-mia.inra.fr/biosp/homepage-denis-allard Denis Allard] (BioSP -- CPI Agriculture Numérique, Dept. MIA, INRA)</span></span>
+
==== 29/01/2021&nbsp;: ''Developing an ontological framework for facilitating the exploitation and re-use of phenomics data based on a formalisation of numerical relationships'' [https://www6.montpellier.inrae.fr/lepse/Organisation/Equipe-M3P-Dev/Luis-Felipe-Vargas-Rojas/ Luis-Felipe Vargas-Rojas] (LEPSE, INRAE) ====
  
:
+
:'''Résumé&nbsp;:''' In recent years, plant phenomics has produced massive datasets involving experiments performed in the field and controlled conditions, concerning hundreds of genotypes at different scales of organisation. Taken together, these datasets are unprecedented resources for identifying and testing novel mechanisms and models (Tardieu et al., 2017). Assembling and organising such datasets is not straightforward because of the heterogeneous, multi-scale and multi-source nature of data, to deal partially with these issues, the phenomics community has proposed an ontology-driven Information System (PHIS, www.phis.inra.fr, Neveu et al., 2019) based on FAIR principles (Wilkinson et al., 2016). However, exploitation and re-use of these datasets have not reached its full potential because (1) metadata is often merely informative, (2) relationships between numerical attributes are poorly formalised, whereas (3) ontological reasoning is more efficient for representing categorical data. For instance, relationships such as unit conversion are not effectively used, even if the data is well-annotated and information to perform the computation is provided by unit ontologies (OM, QUDT). The goal of the thesis is to create an ontological framework for representing and computing different kinds of numerical relationships for plant phenomics attributes. It will focus on equations representing most current variables and data-manipulation processes in  plant phenomics (e.g. unit conversions, thermal time, and phyllochron). For each use-case, details about metadata, context-dependencies, links between domain-specific ontologies and the formalisation of the equation structure, will be presented. Finally, the concrete machinery to perform these context-aware computations and an effective information retrieval, meant to reduce the user's time-effort and the query definition complexity, will be proposed.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Le domaine d'innovation (DI) "Agriculture de Précision", comme les 15 autres domaines de l'innovation définis à l'INRA sont l'un des éléments de la politique partenariat-transfert-innovation (PTI) mise en place à l'INRA depuis 2015 environ. Après avoir rappeler quelques éléments généraux concernant la PTI de l'INRA, et les missions couvertes par un DI, je détaillerai quelques enjeux de recherche relevant du DI "Agriculture Numérique".</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">19/10/2018&nbsp;: '''Séminaire remplacé par la soutenance de thèse de A. Imbert''': ''Intégration de données hétérogènes complexes à partir de tableaux de tailles déséquilibrées'' qui débutera à 14h en salle Marc Ridet</span></span>
+
==== 22/01/2021&nbsp;: ''Predicting the intensity function of point processes  beyond observation areas.'' [http://edith.gabriel.pagesperso-orange.fr/ Edith Gabriel] (INRAE/BioSP) ====
  
:
+
:'''Résumé&nbsp;:''' Seismic networks provide data that are used a basis both for public safety decisions and for scientific research. Their  configuration  affects the data completeness, which in turn, critically affects several seismological scientific targets (e.g., earthquake prediction, seismic hazard...). How to map earthquakes density in seismogenic areas that are not covered by the network? We propose to predict the spatial distribution of earthquakes from the knowledge of presence locations and geological relationships, taking into account any interactions between records. Namely, in a more general setting, we aim to estimate the intensity function of a point process in windows where it has not been observed, conditional to its realization in observed windows, as in geostatistics for continuous processes. We define a predictor as the best linear unbiased combination of the observed point pattern. We show that the weight function associated to the predictor is the solution of a Fredholm equation of second kind. Both the kernel and the source term of the Fredholm equation are related to the second order characteristics of the point process through the pair correlation function. Results are presented and illustrated on simulated nonstationary processes, using continuous covariates or the realization of additional point processes, and real data for mapping Greek Hellenic seismicity in a region with unreliable and incomplete records.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Les avancées des nouvelles technologies de séquençage ont permis aux études cliniques de produire des données volumineuses et complexes. Cette complexité se décline selon diverses modalités, notamment la grande dimension, l'hétérogénéité des données au niveau biologique (acquises à différents niveaux de l'échelle du vivant et à divers moments de l'expérience), l'hétérogénéité du type de données, le bruit (hétérogénéité biologique ou données entachées d'erreurs) dans les données et la présence de données manquantes (au niveau d'une valeur ou d'un individu entier). L'intégration de différentes données est donc un défi important pour la biologie computationnelle. Cette thèse s'inscrit dans un projet de recherche clinique sur l'obésité, DiOGenes, pour lequel nous avons fait des propositions méthodologiques pour l'analyse et l'intégration de données. Ce projet est basé sur une intervention nutritionnelle menée dans huit pays européens et vise à analyser les effets de différents régimes sur le maintien pondéral et sur certains marqueurs de risque cardio-vasculaire et de diabète, chez des individus obèses. Dans le cadre de ce projet, mes travaux ont porté sur l'analyse de données transcriptomiques (RNA-Seq) avec des individus manquants et sur l'intégration de données transcriptomiques (nouvelle technique QuantSeq) avec des données cliniques. La première partie de cette thèse est consacrée aux données manquantes et à l'inférence de réseaux à partir de données d'expression RNA-Seq. Lors d'études longitudinales transcriptomiques, il arrive que certains individus ne soient pas observés à certains pas de temps, pour des raisons expérimentales. Nous proposons une méthode d'imputation multiple hot-deck (hd-MI) qui permet d'intégrer de l'information externe mesurée sur les mêmes individus et d'autres individus. hd-MI permet d'améliorer la qualité de l'inférence de réseau. La seconde partie porte sur une étude intégrative de données cliniques et transcriptomiques (mesurées par QuantSeq) basée sur une approche réseau. Nous y montrons l'intérêt de cette nouvelle technique pour l'acquisition de données transcriptomiques et l'analysons par une approche d'inférence de réseau en lien avec des données cliniques d'intérêt.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">12/10/2018&nbsp;: ''Inférence de données de réseaux multipartites par modèles à blocs latents et stochastiques. Application en écologie et ethnobiologie.'' [https://www6.inra.fr/mia-paris/Equipes/Membres/Sophie-Donnet Sophie Donnet] (MIA Paris, INRA)</span></span>
+
==== 15/01/2021&nbsp;: ''Evolution artificielle interactive : comment aborder le participatif ?'' [http://evelyne.lutton.free.fr/ Évelyne Lutton] (MIA/ISC-PIF) ====
  
:
+
:'''Résumé&nbsp;:''' La question de l’interaction avec l’humain (sa connaissance, son intuition) est centrale pour les approches d’évolution artificielle interactive (iEC). Sur la base d’exemples personnels, cet exposé tente d’identifier quelques thèmes de recherche émergents, en considérant différents contextes, du mono-utilisateur au multi-utilisateurs. Les questions liées aux développements d’applications participatives semblent particulièrement difficiles et intéressantes.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Modéliser les relations entre entités (individus, insectes, plantes...) est une problématique classique en sciences sociales et en écologie et regrouper les entités étudiées en fonction des motifs observés dans le réseau permet de comprendre la topologie du réseau. Les modèle à blocs stochastiques ou latents sont une approche répandue pour regrouper les individus partageant le même comportement d'interaction. Dans ce travail, nous nous intéressons au cas où nous cherchons à modéliser des réseaux multipartites, i.e. des réseaux dans lesquels les entités appartiennent à des groupes fonctionnels prédéfinis. Les modèles à blocs stochastiques ou latents reposent sur l'introduction des variables latentes, rendant leur vraisemblance incalculable de façon explicite dès que la taille des réseaux augmente. Nous utilisons alors une version stochastique de l'algorithme EM. La pertinence de notre modèle et de notre méthode d'inférence est illustrée sur données simulées et réelles.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">05/10/2018&nbsp;: ''Input output kernel regression for protein-protein interaction&nbsp;prediction and metabolite identification''. Céline Brouard (INRA, MIAT) [https://mia.toulouse.inra.fr/images/6/66/Seminaire.pdf diaporama]</span></span>
+
==== 08/01/2021&nbsp;: ''DEX method: recent advances and future challenges on developing predictive models from data'' [http://kt.ijs.si/MarkoBohanec/mare.html Marko Bohanec] et [http://kt.ijs.si/SasoDzeroski/ Sašo Džeroski] (Jožef Stefan Institute, Ljubljana) ====
  
:
+
:'''Résumé&nbsp;:''' In the last decade, decision support and data mining approaches have become indispensable tools for researchers and practitioners in agronomy and related fields. Decision modelling is aimed at developing models, usually through collaboration of decision makers and experts, for suggesting and justifying solutions of the problem at hand. Data mining uses data to find meaningful patterns, most often in the form of predictive models, for a similar purpose. Both types of models can be included in decision support systems for aiding decision makers in recurring decision tasks. This seminar will be given through two 30-minute presentations by two senior researchers from Jožef Stefan Institute, Department of Knowledge Technology, Ljubljana, Slovenia: Marko Bohanec, an expert in decision support and creator of DEX method and DEXi software and Sašo Džeroski, an expert in data mining, leading the development of many data mining tools, and Head of the Department. Marko Bohanec will focus on the method DEX and present some recent advances and plans, for instance inclusion of the option generator method in DEXi. Participants who already know DEXi are kindly asked to pose questions and give comments. Sašo Džeroski will present some methods for mining complex data, in particular methods for multi-target prediction. He will also illustrate their use on several problems from ecology and agriculture.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Many real world learning tasks require predicting outputs that&nbsp;correspond to complex structured objects or to multiple interdependent&nbsp;outputs. Structured prediction approaches making use of the statistical&nbsp; dependencies between the output parts, have been shown to achieve an&nbsp;improved prediction performance in several applications. I will present&nbsp; a kernel-based structured output prediction approach, called Input&nbsp;Output Kernel Regression. In this approach the internal structure of the&nbsp;output data is encoded using a kernel function, that measures the&nbsp;similarity between two outputs. This approach is based on the idea of&nbsp; using the kernel trick in the output space and making predictions in a&nbsp;feature space associated with the output kernel. I will focus in my presentation on two applications of this work. The&nbsp;first application is the prediction of protein-protein interactions.&nbsp;Another application will be presented on the metabolite identification&nbsp;problem, that consists in determining the molecular structure of an&nbsp; unknown metabolite from tandem mass spectrometry data.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">28/09/2018&nbsp;: ''La plateforme Souk.'' [http://homepages.laas.fr/gtredan/ Gilles Tredan] (LAAS, Toulouse)</span></span>
+
==== 25/12/2020 et 01/12/0202&nbsp;: Pas de séminaire (vacances scolaires) ====
  
:
+
==== 18/12/2020&nbsp;: ''De l’aide à la décision à l’aide à la réflexion, un glissement paradigmatique…'' [https://www6.paca.inrae.fr/recover_eng/Laboratory-s-members/Social-Pages/Franck-TAILLANDIER Franck Taillandier] (INRAE/RECOVER) ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Depuis 2012, une partie de nos recherches porte sur la caractérisation des structures d’interaction sociales. Nous avons pour cela développé une plateforme d’observation sociale des «&nbsp;cinétiques&nbsp;» humaines&nbsp;: SOUK (Social Observation of hUman Kinetics). Le principe de cette plateforme est de pouvoir collecter avec une grande précision spatiale et temporelle la position des individus d’une foule dense. SOUK fonctionne à la manière d’un GPS inversé plutôt précis (15cm) et rapide (1-4 hz). Grâce à ce système, il est possible de suivre le déplacement de groupes d'individus (jusqu'à 60 personnes) dans des espaces délimités, et d’analyser les mobilités et interactions au sein de ces groupes. Cet outil a été déployé lors de plusieurs campagnes expérimentales à Toulouse et à Milan dans des contextes variés&nbsp;: personnes dans une foule, danseurs, évènements sociaux (buffets), animaux au sein d’un troupeau... Lors de cette présentation a vocation panoramique, j'aborderai quelques résultats et perspectives issus de l’analyse des données ainsi collectées.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">21/09/2018&nbsp;: ''Données de la recherche… Vers l’ouverture'' Nathalie Gandon (CODIR - Département MIA, INRA) [https://mia.toulouse.inra.fr/images/8/87/SeminaireNathalieGandon.pdf diaporama]</span></span>
+
:'''Résumé&nbsp;:''' Décider est une préoccupation partagée par tous les domaines d’application ; l’étudier, accompagner les gens vers de bons choix est une préoccupation majeure, hier comme aujourd’hui. La recherche scientifique a ainsi investi le champ de l’aide à la décision sous de multiples angles, du plus théorique au plus appliqué. Cela offre un corpus d’une richesse rare et un panel d’outils propres à répondre à de nombreuses problématiques. Mais cela ne va pas sans soulever de questions… Est-on toujours sûr d’utiliser ces outils à bon escient ? Qu’est-ce qu’une bonne décision ou qu’une bonne démarche d’aide à la décision ? D’ailleurs, qu’entend-on par « aide » à la décision ? Ce séminaire n’aura pas vocation à vous apporter toutes les réponses, mais fidèle à la démarche que je prône, à vous faire réfléchir quant à ces questions…
  
:
+
==== 11/12/2020&nbsp;: Analyse de données spectroscopiques par clustering de variables et réduction de dimension interprétables [https://uclouvain.be/fr/repertoires/rebecca.marionRebecca Marion] (UCLouvain - Belgique) [https://sites.google.com/view/rebeccamarion/presentations diaporama] ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Présentation des contextes (international, national et institutionnel), du cadre juridique et des offres de service inra autour de l’open data.</span></span>    
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">14/09/2018&nbsp;: ''Inférence des causes de la reprogrammation cellulaire par abduction'' [https://ibisc.univ-evry.fr/~delapla/ Franck Delaplace] (IBISC, Université d'Evry) [https://mia.toulouse.inra.fr/images/c/ce/Abduction-slide-print-FD.pdf diaporama]</span></span>
+
:'''Résumé&nbsp;:''' En métabolomique, la spectroscopie par résonance magnétique nucléaire (RMN) est un moyen courant de quantifier les concentrations de métabolites. Les spectres RMN sont très reproductibles, ce qui implique que la plupart des variations entre les spectres représentent des différences biologiques entre les échantillons. De plus, comme la spectroscopie RMN peut quantifier des molécules connues et inconnues, elle est particulièrement utile pour identifier et caractériser de nouveaux composés, ce qui en fait une plate-forme importante pour la découverte de biomarqueurs. L'identification des biomarqueurs dans un spectre RMN se résume à l'identification des groupes de variables ou des régions spectrales qui prédisent le mieux le résultat biologique qui nous intéresse. Dans ce séminaire, nous présentons notre nouvelle méthode, Adaptive Clustering around Latent Variables (AdaCLV), qui permet d’identifier de tels clusters de variables de façon non-supervisée. AdaCLV s'inspire des méthodes multivariées existantes de la famille Clustering around Latent Variables (CLV), tout en offrant plusieurs avantages clés par rapport à ces méthodes, tels que sa meilleure précision et son interprétabilité, ainsi que de sa robustesse aux changements de valeurs d’hyperparamètres.
  
:
+
==== 04/12/2020&nbsp;: ''Journée des doctorants du pôle IMABS : [https://miat.inrae.fr/site/images/3/31/ProgrammeSeminaireDoctorants.pdf programme]'' ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La médecine de réseau a pour objectif de définir la maladie à l’échelle des réseaux biologiques afin de mieux comprendre les mécanismes causaux de celle-ci. Des études dans ce domaine ont montré que la reprogrammation comportementale observée dans des maladies complexes telles que le cancer est causée par une modification du câblage du réseau moléculaire. La transition entre cellule saine et malade et inversement peuvent s'interpréter à l'échelle moléculaire comme une reprogrammation cellulaire induite par des perturbations topologiques des réseaux moléculaires induisant des changements du destin cellulaire. Pour la modélisation, l’objectif est d’inférer les actions topologiques sur un réseau induisant une variation de la dynamique incarnant ces transitions. Nous proposons un cadre théorique étendant les réseaux Booléens, appelé ''réseau booléen contrôlé'' où les actions de réseau topologique sont définies comme des contrôles de la dynamique. Sur la base de ce cadre, nous présentons un nouvel algorithme utilisant des principes de raisonnement abductif qui infère les perturbations causales minimales conduisant à un comportement attendu aux états stables de la dynamique. Ce cadre de modélisation s’applique à priori à un grand nombre de situation biologique d’alteration du destin cellulaire reposant sur sa reprogrammation. Nous l’illustrerons sur un modèle du cancer du sein, que nous considérons comme une preuve de concept, en inférant à la fois les oncogènes, les suppresseurs de tumeurs et des cibles thérapeutiques. ''Travail joint avec Célia Biane''</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">7/09/2018&nbsp;: ''SAA-ILP approach for multi-objective landscape optimization under uncertainty: theory and application'' [https://yanndujardinsite.wordpress.com/ Yann Dujardin] (MIAT)</span></span>
+
==== 27/11/2020&nbsp;: ''Simulation en recherche médicale. Généralités, exemple et problème connexe.'' [https://perso.math.univ-toulouse.fr/savy/ Nicolas Savy] (IMT) [https://miat.inrae.fr/site/images/3/36/SEMINAIRE_INRAe_SAVY.pdf diaporama] ====
  
:
+
:'''Résumé&nbsp;:''' Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' ''Theory:'' The Graph-based Markov Decision Process (GMDP) framework forms a class of MDP with factored state and action spaces, which has been studied for the past ten years. Since state and action spaces share the same graphical structure, it may be useful to model the control of spatial processes or collaborative multi-agent decision problems with local interactions. The concept of local policies in GMDP is especially useful, since it leads to interpretable objects, unlike optimal global policies which usually require exponential space to represent. Several time efficient algorithms to compute approximate local policies in GMDP have been proposed in the last decade. On the other hand, while efficient in practice, existing algorithms come without any performance guarantee on the returned local policies. Furthermore, while real-world collaborative decision problems modeled by GMDP generally contain several objectives to be optimized, no attention has been given yet, to our knowledge, to multi-objective GMDP. Our first contribution is to propose a Sample Average Approximation (SAA) approach for GMDP combined with an original ILP formulation. Unlike existing algorithms for GMDP, we provide theoretical hardness results and performance guarantees. Then, we show how the SAA-ILP approach can model and solve multi-objective GMDP. ''Application:'' An agricultural landscape can be devised according to various criteria,often antagonist (all of them cannot be optimized simultaneously). When managing agro-ecosystems, finding "good compromise" solutions between these criteria is therefore&nbsp;critical. However, finding landscape management strategies that enable to reach satisfying trade-offs on different criteria is difficult for several reasons: 1) the processes involved in these strategies making are spatio-temporal processes, 2) decision must been made under uncertainty, 3) modeling and solving multi-objective optimization problems is more difficult that mono-objective ones. We consider the problem of finding best compromise solutions to a particular multi-objective landscape management problem under uncertainty. Possible decisions consist in assigning a sequence of cultures, over a time horizon, to every site of an agricultural network. These sequences will directly influence three criteria: total profit, biodiversity, and equity between the stakeholders. Sequences also influence pollinators dynamics, the position of which can itself influence the criteria in another way. Criteria are computed over a time horizon. The dynamics of the pollinators are spatio-temporal and subject to uncertainty. To solve this problem, we propose a multi-objective SAA-ILP-based solver that allows a decision-maker to interactively discover the agricultural landscape that corresponds to a (subjective) best compromise between the criteria.</span></span> 
 
  
== Séminaires passés / Past seminars &nbsp;: ==
+
==== 20/11/2020&nbsp;: ''Development of decision support systems for application in agronomy''. [http://landmark2020.eu/member/marko-debeljak/ Marko Debeljak] (Jožef Stefan Institute, Ljubljana) [https://miat.inrae.fr/site/images/8/8a/2020_11_20_INRAe_Debeljak.pdf diaporama] ====
 +
 
 +
:'''Résumé'''&nbsp;: Agronomy is increasingly embedded in the broader social and economic context. Its obligations and commitments to meet the objectives of sustainable development goals and ecosystem services are increasing. Due to the rapid development of other fields of research, agronomy is intensively introducing digitisation, which is leading to the accumulation of ever-increasing amounts of data. In parallel with digitisation, extensive informatisation is taking place in agronomy too. It increases the exchange and collection of large amount of knowledge and experiences. Agronomy is in a position where it must make quick and correct decisions about the growing number of problems and expectations of society. Therefore, decision-making in agronomy has become an extremely complex process that can only be managed with an objective scientific approach. Experiences from systems ecology and ecological modelling for the development of decision support systems have proven to be very helpful. The application of methods developed in the field of systems ecology allows us to build a high quality architecture of decision support systems that takes into account the specifics of the agronomic system. The design of a decision support system (DSS) should be a problem driven process. This requires a clear definition and role of all stakeholders which are directly or indirectly involved in the development and application of the DSS. When developing the elements of the DSS structure, the advantages of modern information and computer technology must be used. The structure of the decision models as central elements of the DSS must meet all criteria to ensure their quality and reliability. Decision models must therefore be constructed according to a clearly defined procedure for building ecological models. Any possibility that the DSS might propose wrong decisions that could be the result of a non-functional decision model, must be excluded. In this seminar, I will present the methodology of building decision support systems on three selected cases. The first example is the system for the assessment and management of the risk of surface and groundwater pollution with pesticides, which we developed for ARVALIS - Institut du végétal, France. Another example is the DSS for the simultaneous assessment of five soil functions, which we developed in the H2020 project LANDMARK. The third system, which is still under development, will assess the sustainability of the agronomic value chain based on legumes. We are developing it as part of the H2020 project TRUE.  In all systems, the method DEX is used to build qualitative multi-attribute decision models. We complement the existing agricultural expertise with knowledge obtained from data mining. All three decision support systems interact with the users via internet interfaces.
 +
 
 +
==== 13/11/2020&nbsp;: ''Conception et mise en œuvre d’un système modulaire de mini-bioréacteurs pour la culture continue de microorganismes''. Cyprien Guérin (Inrae, MaIAGE) ====
 +
 
 +
:'''Résumé'''&nbsp;:  Les systèmes de culture continue en bioréacteurs restent, malgré leur intérêt, peu utilisés dans les laboratoires de microbiologie. L’objectif de ce projet de thèse est de faciliter leur mise en œuvre en proposant un nouveau système modulaire de mini-bioréacteurs pilotés par ordinateur en s’appuyant sur les opportunités offertes par l’essor des technologies de fabrication numérique et des microcontrôleurs programmables. Les volumes de culture visés sont de l’ordre de 5 à 10 mL afin de permettre des plans d’expériences complexes pouvant impliquer de nombreux bioréacteurs (en parallèle, en cascade, avec suivi et contrôle en temps réel, ...). Comme preuves de concept, plusieurs applications chez la bactérie Gram-positive ''Bacillus subtilis'' sont envisagées aussi bien dans des contextes d’évolution expérimentale et dirigée que pour des études physiologiques s’appuyant sur de la comparaison de transcriptomes.
 +
 
 +
==== 06/11/2020&nbsp;: ''ComMod une posture !'' Etienne Delay (CIRAD, GREEN) [https://rawcdn.githack.com/ElCep/ComMod_pres/0e2e06875259e42c2e4929dc4b5182e6f3a9a1db/index.html#/ diaporama] ====
 +
 
 +
:'''Résumé''' : Les modèles multi-agents et les jeux de rôles sont des outils de représentation et de simulation du fonctionnement des socio-écosystèmes qui aident à franchir les frontières disciplinaires pour étudier les processus de coordination entre acteurs et de décision collective. Depuis 20 ans l'UPR GREEN au CIRAD les utilisons dans le cadre d’une approche qualifiée de « modélisation d'accompagnement » (companion modeling approach). Cette présentation sera l'occasion de présenter la construction méthodologique de l'approche et ses évolutions à travers mes yeux de « dernier recruté » dans l'unité GREEN. Une occasion de raccrocher ce travail avec des problématiques de gestion des ressources naturelles, de bien commune, et de liens sociaux.
 +
 
 +
==== 23-30/10/2020&nbsp;: Pas de séminaire (vacances scolaires) ====
 +
 
 +
==== 16/10/2020&nbsp;: ''Estimation of species environmental niches and sampling effort from presence only records and illustration on the Pl@ntNet citizen-science flora data''. [http://christophebotella.fr/ Christophe Botella] (LECA) ====
 +
 
 +
:'''Résumé''': Naturalist mobile applications have been deployed worldwide in the last years and enabled access to a considerable amount of geolocated species presences records. This novel type of data represents a step forward to address ecological and conservation questions through the use of species distribution models (SDMs). However, in the absence of a sampling protocol, the sampling effort often concentrates on specific locations (cities, riverside walks, etc.) located in specific environments, resulting in estimation biases in SDMs. During my PhD, I studied methods to minimize bias in the estimation of inhomogeneous Poisson point processes (IPP) modelling species habitats preferences. I will present two approaches: (i) pooling occurrences from many species, using them as background points in the IPP and conditions under which it yields unbiased estimates, and (ii) the joint modeling of multiple species densities along with a common sampling effort component. Finally, I will show an illustration on Pl@ntNet's citizen science data over the whole French territory, integrating several hundred plant species and hundreds of thousands of observations over France with a highly biased sampling.
 +
 
 +
==== 09/10/2020&nbsp;: ''Model Exploration in Practice''. [https://iscpif.fr/projects/romain-reuillon/ Romain Reuillon] (CNRS, ISC-PIF) ====
 +
 
 +
:'''Résumé'''&nbsp;: The use of simulation models has widely spread in recent years, in various fields of academic research. Models are being developed to represent and try to better understand all kinds of systems: population dynamics, epidemics, transportation systems, macro-scale systems, micro-scale systems, etc. In some scientific areas, models and in silico simulations have become essential to help study in vivo situations.
 +
: However, simulation models are necessarily a simplification of reality, and hypotheses have to be made when developing a model. Thus every model can (and needs to?) be questioned: Is it relevant to tackle the research question behind it? How to extract significant knowledge from the model? What kind of dynamics can it exhibit? How does each mechanism of the model impact those dynamics? Is every mechanism really necessary? These are just some of the many questions a model developer has to answer in order to really know and understand his/her model!
 +
:This talk focuses on the worldwide zombie epidemic of the past few years. It raises the question of what can modelers say about it, and, it attempts to use model exploration, OpenMOLE (openmole.org) and the associated exploration methodology to build knowledge on this forefront phenomenon.
 +
 
 +
==== 02/10/2020&nbsp;: ''Méthodes mathématiques en écologie''. [https://www.ummisco.fr/?page_id=1150 Tri Nguyen-Huu] (IRD)  ([https://miat.inrae.fr/site/images/7/7e/Pr%C3%A9sentation_MIAT_%28light%29.pdf diaporama]) ====
 +
 
 +
:'''Résumé'''&nbsp;:  Le développement de modèles mathématiques ont permis d'apporter un point de vue neuf sur des questions écologiques d'ordre général ou bien appliquées. Des modèles abstraits permettent de mieux comprendre les processus régissant certains écosystèmes, tandis que des modèles plus descriptifs permettent d'avoir une vision plus quantitative des phénomènes étudiés. Nous présenterons quelques modèles mathématiques issus des systèmes dynamiques (équations différentielles, équations aux différences finies) et nous intéresserons à ce qu'ils peuvent apporter à l'étude de quelques problèmes écologiques, à savoir la dynamique bio-économique des pêcheries, la connectivité d'espèces marines récifales, et la conservation des grands herbivores dans les parcs nationaux du Kenya.
 +
 
 +
==== 25/09/2020&nbsp;: ''Learning with pangenomes''. [https://lbbe.univ-lyon1.fr/-Jacob-Laurent-.html?lang=fr Laurent Jacob] (CNRS, LBBE) ====
 +
 
 +
:'''Résumé'''&nbsp;: As the number and variety of sequenced genomes grows, representing them by comparison to a single reference leads to an increasing level of approximation, discarding accessory genes, rearrangements and repeated regions. This problem is particularly acute when studying microbial genomes or metagenomes, and hinders essential statistical tasks such as GWAS or prediction in this context. I will discuss genome representations which are well suited to statistical analysis when genomes are ill-suited to alignment or even assembly.
 +
 
 +
==== 18/09/2020&nbsp;: ''Partager de l'information pour faire face à un virus. Etude de cas en ostréiculture via un modèle multi-agent.'' Nicolas Paget (CIRAD)  ====
 +
 
 +
:'''Résumé'''&nbsp;: Le postulat selon lequel le partage d'information permet de meilleures prises de décisions est fortement ancré. En développant un modèle multi-agent sur la plateforme Cormas, nous avons questionné ce postulat. Depuis quelques années, les ostréiculteurs font face à un virus (os-hv1) au fort taux de létalité. Ce virus n'est que mal connu. Dans le modèle, les agents, de rationalités variées, partagent leurs expériences et en tirent des leçons pour leurs pratiques. Nous étudions alors le type de décision prise par les agents en fonction de scénarios de partage de l'informations et d'hétérogénéité des agents. Les résultats montrent que l'hétérogénéité des agents permet une meilleure exploration de l'espace des possibles et qu'un partage et une interprétation trop radicaux des expériences de chacun à un effet contreproductif. Ce travail a été effectué en thèse. Lors de cette présentation, j'évoquerai aussi des travaux ou pistes de travaux plus récents ou en cours d'initialisation dans l'idée de susciter des collaborations.
 +
 
 +
==== 11/09/2020&nbsp;: ''Thigmoimmunité végétale. Comment la mécanoperception participe à la réponse immunitaire''. Adelin Barbacci (LIPM) ====
 +
 
 +
:'''Résumé'''&nbsp;:  Les attaques de parasites sont responsables chaque année de pertes de récolte considérables à travers le monde. La recherche de sources génétiques de résistance durable chez les plantes constitue un levier important pour répondre à la demande alimentaire mondiale. ''Sclerotinia sclerotiorum'' est le champignon pathogène responsable de la maladie de la pourriture blanche sur plus de 400 espèces végétales, causant plusieurs millions d’euros de pertes de récolte chaque année, notamment sur colza. Comme la majorité des agents pathogènes, ''S. sclerotiorum'' utilise la sécrétion de molécules effectrices pour manipuler la physiologie des plantes hôtes et favoriser son développement. La mise en place de la QDR est consécutive à la perception du champignon. Toutefois, contrairement à la résistance gène-pour-gène plus largement étudiée, la QDR mobilise de nombreux réseaux de gènes qui sont encore méconnus et ne sont pas tous spécifiquement dédiés à l’immunité. Or, l'interaction plante-champignon met en jeu des signaux mécaniques importants, intrinsèques à la pénétration des tissus de l’hôte.
 +
:Au cours de ces deux dernières années nous avons réussi à montrer que les signaux mécaniques jouent un rôle de premier plan dans la mise en place de la réponse immunitaire et qu’il était possible de moduler fortement le niveau de résistance des plantes grâce à des ondes mécaniques. Ce travail est le fruit d’une collaboration étroite entre des équipes de physique (Aroune Duclos Laboratoire d’Acoustique de l’Université du Mans), de physiologie végétale (Nathalie Leblanc-Fournier INRA PIAF Clermont, Tou-Cheu Xiong INRA BPMP Montpellier) de biologie moléculaire (Adelin Barbacci LIPM) et de modélisation mathématique et informatique (Frédérick Garcia MIAT). C’est également le point de départ de la thèse de Khaoula Hadj-Amor coencadrée par MIAT et le LIPM. L’exposé s’attachera à présenter nos aventures entre mécanoperception, proprioception et réponse immunitaire.
 +
 
 +
== Séminaires reportés à une date ultérieure ==
 +
 
 +
====  ''KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows''. [https://imag.umontpellier.fr/~charlier/ Benjamin Charlier] (Université de Montpellier, ARAMIS)====
 +
 
 +
:'''Résumé&nbsp;:''' The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula.  It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
 +
:KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU.  KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
 +
:Web site: http://www.kernel-operations.io
 +
 
 +
== Séminaires passés / Past seminars ==
  
 
Lien vers la [[List_of_past_seminars|Liste des séminaires passés]] de l'unité MIAT.
 
Lien vers la [[List_of_past_seminars|Liste des séminaires passés]] de l'unité MIAT.
  
== Contacts: ==
+
== Contacts ==
  
Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter [mailto:patrick(dot)taillandier(at)toulouse(dot)inra(dot)fr Patrick Taillandier] ou [mailto:matthias(dot)zytnicki(at)toulouse(dot)inra(dot)fr Matthias Zytnicki].
+
Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter [mailto:nathalie(dot)vialaneix(at)inra(dot)fr Nathalie Vialaneix] ou [mailto:sandra(dot)plancade(at)inra(dot)fr Sandra Plancade].

Version actuelle datée du 16 juillet 2021 à 11:42

Sommaire

Séminaires de l'unité MIAT

Pyrenees-morning.jpg

Le séminaire de l'équipe MIAT d'INRAe Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.

Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT d'INRAe Auzeville/Castanet est indiqué ici (nous sommes à moins de 30 mètres de la réception !).

Séminaires de l'année en cours et séminaires futurs

12/11/2021 : Titre à venir Céline Bougel (visiteuse scientifique IMABS, INRAE)

29/10/2021 et 05/11/2021 : Vacances scolaires - pas de séminaire

22/10/2021 :

15/10/2021 : Séminaire interne (SaAB)

08/10/2021 : Titre à venir Charlotte Pelletier

01/10/2021 : Titre à venir Raphaël Mourad (IBCG, Université Toulouse 3 & Délégation INRAE MIAT)

24/09/2021 : Journée « Impact carbone de la recherche et du numérique » dans le cadre des animations IMABS

17/09/2021 : Titre à venir Amine Ghozlane (Institut Pasteur)

10/09/2021 : Titre à venir Paul Terzian (Séminaire interne, plateforme Bioinformatique)

03/09/2021 : Titre à venir Laurent Tournier (INRAE, MaIAGE)

09/07/2021 : Journée des stagiaires

02/07/2021 à 9h15 : Soutenance de thèse de Gaëlle Lefort « Quantification automatique de métabolites dans un spectre RMN et application à la description de la maturité périnatale chez le porc »

Résumé : Parmi les nombreuses données omiques qui décrivent le fonctionnement biologique d'un organisme, le métabolome suscite un intérêt croissant car il est plus proche des phénotypes d'intérêt et qu'il a donc avoir un potentiel important pour la recherche de \emph{biomarqueurs}. La spectrométrie par résonance magnétique nucléaire (RMN) est une technologie haut-débit qui produit des spectres caractéristiques du mélange complexe de métabolites présents dans un échantillon d'intérêt. Cependant, leur interprétation biologique est difficile car ceux-ci ne donnent pas une mesure explicite des différentes quantités de métabolites présents dans l'échantillon.
Une approche prometteuse pour l'analyse de ces données consiste à identifier et quantifier les métabolites présents dans le mélange complexe à partir de son spectre et à réaliser l'analyse statistique sur les résultats de cette quantification. Une première partie de cette thèse a consisté en l'amélioration d'une méthode de quantification existante, ASICS, ainsi qu'à son implémentation dans un package R/Bioconductor. Une nouvelle méthode, prenant en compte l'ensemble des spectres d'une expérience lors de la quantification, a aussi été proposée dans le but d'améliorer la fiabilité des résultats.
Un second volet de cette thèse concerne l'application de cette méthode au problème de mortalité néonatale des porcelets et plus précisément à la description des mécanismes impliqués dans la mise en place de la maturité. L'analyse des spectres RMN de plasma, d'urine et de liquide amniotique de fœtus en fin de gestation a permis d'identifier des voies métaboliques impliquant de nombreux acides aminés et sucres (croissance et apport d'énergie) ainsi que le métabolisme du glutathion (stress oxydatif).

25/06/2021 : Multi-omics data integration: towards a comprehensive view of cancer Laura Cantini (CNRS, IBENS)

Résumé : Due to the advent of high-throughput technologies, high-dimensional “omics” data are produced at an increasing pace. In cancer biology, national and international consortia have profiled thousands of tumors at multiple molecular levels (“multi-omics”) allowing to gather a comprehensive molecular picture of this disease. Moreover, multi-omics profiling approaches are currently being transposed at single-cell resolution, further increasing the information accessible from cancer samples. The current main challenge is to design appropriate methods to integrate this wealth of information and translate it into actionable biological knowledge.
In this talk, I will discuss two main computational directions for multi-omics integration: (i) multilayer networks to integrate a large range of interactions and (ii) joint dimensionality reduction to extract biological knowledge simultaneously from multiple omics. First, I will present their application on bulk data and then I will discuss our ongoing research in single-cell.
Selected associated publications & preprints
Cantini L, Medico E, Fortunato S, Caselle M. Detection of gene communities in multi-networks reveals cancer drivers. Scientific reports. 2015 Dec 7;5(1):1-0.
Cantini, L., Zakeri, P., Hernandez, C., Naldi, A., Thieffry, D., Remy, E., Baudot, A., 2021. Benchmarking joint multi-omics dimensionality reduction approaches for the study of cancer. Nature Communications 12.
Kang Y, Thieffry D, Cantini L. Evaluating the reproducibility of single-cell gene regulatory network inference algorithms. Frontiers in genetics. 2021 Mar 22;12:362.
Huizing GJ, Peyré G, Cantini L. Optimal Transport improves cell-cell similarity inference in single-cell omics data. bioRxiv. 2021 Jan 1.

18/06/2021 : Extensive benchmark of machine learning methods for quantitative microbiome data Magali Berland (MetaGenoPolis, INRAE)

Résumé : Characterization of microbial communities with omics technologies shed to light powerful biomarkers for diagnosis and prognosis in human health. In particular, shotgun metagenomics allows a highly precise microbiome profiling. Indeed, prediction of phenotypic features, such as clinical status or disease states can help to stratify patients which is the first step toward precision medicine. Many machine learning (ML) methods have been developed to tackle classification and regression problems yet statistical specificities of metagenomic data make difficult the learning task. We developed a R workflow designed to compare ML methods for classification or regression from the caret package. The Activeon Proactive engine was used to efficiently distribute the computing load on multiple servers. We then applied our workflow on a dataset where the fecal microbiota of patients with cardiovascular diseases is compared to healthy controls using shotgun metagenomics.

11/06/2021 : Hybrid direct and iterative solvers for the sparse indefinite and overdetermined systems on future exascale architectures Philippe Leleux (CERFACS)

Résumé : In scientific computing, the numerical simulation of systems is crucial to get a deep understanding of the physics underlying real world applications. The models used in simulation are often based on partial differential equations (PDE) which, after fine discretisation, give rise to huge sparse systems of equations to solve. Historically, 2 classes of methods were designed for the solution of such systems: direct methods, robust but expensive in both computations and memory; and iterative methods, cheap but with a very problem-dependent convergence. In the context of high performance computing, hybrid direct-iterative methods were then introduced in order to combine the advantages of both methods, while using efficiently the increasingly large and fast supercomputing facilities. In this thesis, we focus on the latter type of methods with two complementary research axes. In a first research track, we detail the mechanisms behind the efficient implementation of multigrid methods. The latter makes use of several levels of increasingly refined grids to solve linear systems with a combination of fine grid smoothing and coarse grid corrections. The efficient parallel implementation of such a scheme is a difficult task. We then focus on the improvement of the parallel efficiency of a multigrid scheme and in particular the scalability of the solver used on the coarsest grid. At extreme scale, this study is carried in the HHG framework (Hierarchical Hybrid Grids) for the solution of a Stokes problem with jumping coefficients, inspired from Earth's mantle convection simulation.
In the following chapters, we study some hybrid methods derived from the classical row-projection method block Cimmino, and interpreted as domain decomposition methods. These methods are based on the partitioning of the matrix into blocks of rows on which projections are computed to iteratively approximate the solution of a linear system. Both methods are implemented in the parallel solver ABCD-Solver (Augmented Block Cimmino Distributed solver). Finally, for the solution of discretized PDE problems, we propose a new approach using a coarse representation of the space to obtain an iterative method with fast linear convergence, demonstrated on Helmholtz and Convection-Diffusion problems.

04/06/2021 : Hidden semi-Markov models : inference, control and applications Nathalie Peyrard (Séminaire interne, équipe SciDyn)

Résumé : Le cadre HSMM est une extension du cadre HMM, où les durées de séjour dans les états cachés sont modélisées explicitement.
Je présenterai les travaux en cours dans SCIDyn sur le thème de l'inférence dans les HSMM avec des applications en croissance des plantes et en inférence de chemins migratoires chez les oiseaux, ainsi que le projet HSMM-INCA soumis cette année à l'ANR.

28/05/2021 : Optimisation agronomique par simulation et intelligence artificielle: application à la conduite de systèmes agroforestiers Antoine Labatie

Résumé : L'avènement récent du "deep learning" a permis des avancées majeures dans de multiples domaines applicatifs : robotique, voitures autonomes, imagerie médicale, traitement du langage, jeu de go, etc. L'un des éléments ayant permis toutes ces avancées est l'utilisation de grandes quantités de données pour l'entraînement des modèles. Lorsque ces grandes quantités de données ne peuvent pas être obtenues en conditions réelles, des simulateurs sont souvent utilisés comme "générateurs" de données proches des conditions réelles. Il semble prometteur d'utiliser cette approche en agronomie compte tenu d'une part de la difficulté fréquente d'acquisition de données réelles, et d'autre part de la préexistence de simulateurs agronomiques.
Cette présentation exposera le travail récent que j'ai effectué en suivant cette approche. Ce travail, qui est effectué en collaboration avec l'équipe développant le simulateur Hi-sAFe à l'INRAE (UMR System), vise à l'optimisation de la conduite de systèmes agroforestiers. Je présenterai d'abord les algorithmes standards d'IA utilisés pour résoudre ce type de problème d'optimisation. Je présenterai ensuite les adaptations de ces algorithmes qui ont dû être faites dans ce contexte précis pour améliorer la performance finale. Je présenterai enfin quelques résultats concrets et leurs possibles interprétations.

21/05/2021 : Classer la migration à l'ère du Big Data. Est-il possible d'identifier le comportement de migration par des routines automatiques ? Performance de 3 méthodes, MigrO, MigrateR et une approche de segmentation Lucie Debeffe (INRAE, CEFS)

Résumé : Migration remains a complex phenomenon, and previous work has shown the potential inconsistencies in the classification of movement. Here we aimed at evaluating the criticalities in the uninformed, automatic identification of ungulate migration with a test-case. Specifically, we first evaluate the robustness of different routines applied to the same datasets; and second, disentangle how the robustness of classification is affected by the routine applied, or, conversely, by the definition of the biological phenomenon that is then used to parametrise such routines. A dataset of 261 trajectories from 21 populations of one species distributed at the continental scale (red deer from Euromammals/Euroredeer database: euroreddeer.org) was used. We classified each trajectory into migratory and non-migratory (resident and dispersal) movements with three unsupervised procedures that rely on spatio-temporal definition of seasonal ranges. Further, we compared the automatic classification output with visual classification from ecologists and wildlife biologists with a different degree of knowledge of migratory behaviour and red deer populations. By doing this, we aimed to specifically evaluate the consistency in identification of migration.

14/05/2021  Pont de l'ascension (pas de séminaire)

07/05/2021 : SIWAA, le site web Galaxy pour la simulation et l'analyse mathématique des agroécosystèmes Patrick Chabrier (équipe RECORD, séminaire interne) diaporama

Résumé : L'équipe RECORD administre et développe le site web SIWAA pour l'analyse et la simulation de modèles dans le périmètre des agroécosystèmes. Ce site web repose sur le framework Galaxy qui est déployé à la fois sur des ressources informatiques INRAE et sur le mésocentre de l'université de Montpellier. Nous présentons à la fois les motivations et les grandes lignes de l'architecture de ce site Web pour fournir un retour d'expérience à la fois technique et organisationnel sur le fonctionnement du système en place. On aborde aussi la question du processus de développement informatique visant à ajouter des outils sur le site web, mobilisant en particulier des services de la forge MIA.

23/04/2021 et 30/04/2021  : Pas de séminaire (vacances scolaires)

16/04/2021 : Optimal convergence rates for Nesterov acceleration. Aude Rondepierre (INSA/IMT) diaporama

Résumé : In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.

09/04/2021 : Properties of the stochastic approximation EM algorithm with mini-batch sampling Estelle Kuhn (MaIAGE, INRAE) diaporama

Résumé : To deal with very large datasets a mini-batch version of the Monte Carlo Markov Chain Stochastic Approximation Expectation– Maximization algorithm for general latent variable models is proposed. For exponential models the algorithm is shown to be convergent under classical conditions as the number of iterations increases. Numerical experiments illustrate the performance of the mini-batch algorithm in various models. In particular, we highlight that mini-batch sampling results in an important speed-up of the convergence of the sequence of estimators generated by the algorithm. Moreover, insights on the effect of the mini-batch size on the limit distribution are presented. Finally, we illustrate how to use mini-batch sampling in practice to improve results when a constraint on the computing time is given.
Joint work with Catherine Matias and Tabea Rebafka

02/04/2021 : Développements autour de l'assemblage Matthias Zytnicki et Andreea Dréau (équipe SAaB, Séminaire interne) diaporama

Résumé : L'assemblage est le processus, complexe, de reconstruction de génomes. Lors du séminaire d'unité présenté par Clément Birbes, vous avez vu qu'il fait intervenir de nombreuses technologies, apportant chacune une information parcellaire, à assembler de façon à reconstruire l'intégralité du génome, qui dépasse, dans les cas d'intérêts, le milliard de nucléotides (les A, C, G, T du génome). Dans le cadre du projet SeqOccIn, nous vous présenterons les travaux en cours, qui ont pour but d'améliorer les outils d'assemblage. Nous avons travaillé sur deux parties: l'assemblage à partir de 10X, et l'intégration de données d'assemblage. Ces travaux seront présentés, comme il se doit, de façon très pédagogique.

26/03/2021 : A novel regularized approach for functional data clustering: an application to milking kinetics in dairy goats Christophe Denis (LAMA, Université Paris-Est Marne-la-Vallée) diaporama

Résumé : Motivated by an application to the clustering of milking kinetics of dairygoats, we propose in this talk a novel approach for functional data clustering. This issue is of growing interest in precision livestock farming that has been largely based on the development of data acquisition automation and on the development of interpretative tools to capitalize on high-throughput raw data and to generate benchmarks for phenotypic traits. The method that we propose falls in this context. Our methodology relies on a piecewise linear estimation of curves based on a novel regularized change-point estimation method. Our technique is applied to milk emission kinetics data with the aim of a better characterization of inter-animal variability and toward a better understanding of the lactation process.

19/03/2021 : DeepG4: A deep learning model for sequence-driven DNA G4 formation Vincent Rocher (CBI, Université Paul Sabatier)

Résumé : G-Quadruplex (G4) are alternative DNA secondary structures composed of Guanine-rich DNA sequences which can form a four-stranded structure based on a simple strand, and let the second one free. These structures have been found initially on telomeres, but more recent studies found an enrichment of theses structures on promoters of active genes, and suggest an active role in transcription of these genes. Former in-silico methods to detect and study G4 remained mostly on the detection of a specific motif chain, but recent methods have been developed to identify G4 at genome-wide scale using Next Generation sequencing approach, like G4-seq (in-vitro G4) and BG4-seq (in-vivo). Here, we propose a sequence-based computational Deep learning model to predict in-vivo DNA G4 using the DNA sequences of BG4-seq peaks, in order to detect new motifs involved in the G4 prediction. Deep learning is a recent and popular Machine learning set of approaches where model learn features directly from the data, meaning that we could identify de-novo motifs that are related to G4 prediction. This model can be applied to any DNA sequence to predict the G4 formation, and be used in genetics to study the impact of SNP's on the DNA G4 formation propensities.

12/03/2021 : Processus d’assemblage de génomes grâce aux nouvelles technologies de séquençage Clément Birbes (plateforme bio-info, Séminaire interne)

Résumé :Le projet Sequencage Occitanie Innovation (SeqOccIn) a pour but de développer davantage l’expertise bio-informatique et bio-statistique indispensable aux analyses en génomique, une source majeure d’innovation pour la recherche publique et pour les entreprises. Ce projet est divisé en trois niveaux d’études. L’axe 1 pour le génome, connaissance de la variabilité du génome. L’axe 2 pour l’épigénome, l’étude des marques épigénétique de régulation de l’expression du génome. L’axe 3 pour les métagénomes, pour l’analyse fine des communautés au sein d’un métagénome. Ce séminaire sera une « initiation » aux techniques et aux données utilisées pour l’assemblage des génomes mais sera également l’occasion de présenter une partie des travaux réalisés sur l’axe 1 du projet.

05/03/2021 exceptionnellement à 11h : Pourquoi et comment réduire les émissions de gaz à effet de serre du secteur de la recherche en France ? L’approche bottom up proposée par Labos 1point5. Odile Blanchard (GAEL, Université de Grenoble) diaporama

Résumé : La France s’est engagée à la neutralité carbone à l’horizon 2050. Cela signifie que les émissions de gaz à effet de serre de la France doivent diminuer fortement, de façon très rapide, pour atteindre zéro émissions nettes en 2050.
Le séminaire vise d’une part à discuter pourquoi le secteur de la recherche doit contribuer à la réduction des émissions de gaz à effet de serre de la France et d’autre part à exposer comment le collectif Labos 1point5 s’est emparé de la question depuis 2 ans au sein de la communauté scientifique française.
Le séminaire sera l’occasion de présenter le collectif Labos 1point5, ses objectifs, sa structuration, ses travaux. Un temps particulier sera consacré à l’outil d’estimation des émissions de gaz à effet de serre des laboratoires, GES 1point5. Développé par le collectif dans une démarche bottom up, GES 1point5 permet à la fois de définir des plans d’actions pour réduire les émissions de gaz à effet de serre des laboratoires, de mener des expérimentations dans ce domaine dans les laboratoires, et d’engager des travaux de recherche sur l’empreinte carbone de la recherche.

05/03/2021 à 10h : Soutenance de thèse de Jelena Vucinic : Modélisation moléculaire et Intelligence Artificielle pour le design computationnel de protéines: conception d'enzymes optimisées et de nano-anticorps

01/03/2021 à 15h : Soutenance de thèse Manon Ruffini : Modèles et méthodes pour les problèmes de design de protéines multi-états

19/02/2021 et 26/02/2021 : Pas de séminaire (vacances scolaires)

12/02/2021 : A metagenomic-data-based model of the gut microbiota Simon Labarthe (INRAE/MaIAGE)

Résumé : The human gut harbors a complex bacterial community, the gut microbiota, that maintains a symbiotic relationship with its host: the microbiota ecology is then linked to the host’s health. Mathematical models of the microbial population dynamics are therefore a promising tool to study the mechanisms driving the homeostasis or the dysbiosis of the microbiota, and the links with pathologies.
We couple a PDE population dynamics model of functional microbial meta-populations involved in fibre degradation to a fluid mechanic model of the intestinal content. The metabolic capabilities of the meta-populations are inferred from functional metagenomic data through NMF (non-negative matrix factorization). Metabolic models of the meta-populations are built to predict the metabolite consumptions and the growth rates, and are plugged to the PDE population dynamics model to account for the interactions between the bacterial populations and the intestinal environment. Furthermore, the taxonomic composition of the meta-populations is derived from an additional non-negative least square problem regressing taxonomic marker gene counts against the weight matrix resulting from the previous NMF. This approach makes possible direct comparisons between the model outputs and both gene (shotgun) or bacterial (16s) counts.
This work is a collaboration with B. Laroche, and with M. Ribot, B. Polizzi, T. Phan and T. Goudon for the population/fluid dynamics model of the microbiota and its environment, and with L. Darrigade and M.Leclerc for the metapopulation construction.

05/02/2021 : Journée reproductibilité dans le cadre des animations IMABS programme à ce lien

29/01/2021 : Developing an ontological framework for facilitating the exploitation and re-use of phenomics data based on a formalisation of numerical relationships Luis-Felipe Vargas-Rojas (LEPSE, INRAE)

Résumé : In recent years, plant phenomics has produced massive datasets involving experiments performed in the field and controlled conditions, concerning hundreds of genotypes at different scales of organisation. Taken together, these datasets are unprecedented resources for identifying and testing novel mechanisms and models (Tardieu et al., 2017). Assembling and organising such datasets is not straightforward because of the heterogeneous, multi-scale and multi-source nature of data, to deal partially with these issues, the phenomics community has proposed an ontology-driven Information System (PHIS, www.phis.inra.fr, Neveu et al., 2019) based on FAIR principles (Wilkinson et al., 2016). However, exploitation and re-use of these datasets have not reached its full potential because (1) metadata is often merely informative, (2) relationships between numerical attributes are poorly formalised, whereas (3) ontological reasoning is more efficient for representing categorical data. For instance, relationships such as unit conversion are not effectively used, even if the data is well-annotated and information to perform the computation is provided by unit ontologies (OM, QUDT). The goal of the thesis is to create an ontological framework for representing and computing different kinds of numerical relationships for plant phenomics attributes. It will focus on equations representing most current variables and data-manipulation processes in plant phenomics (e.g. unit conversions, thermal time, and phyllochron). For each use-case, details about metadata, context-dependencies, links between domain-specific ontologies and the formalisation of the equation structure, will be presented. Finally, the concrete machinery to perform these context-aware computations and an effective information retrieval, meant to reduce the user's time-effort and the query definition complexity, will be proposed.

22/01/2021 : Predicting the intensity function of point processes beyond observation areas. Edith Gabriel (INRAE/BioSP)

Résumé : Seismic networks provide data that are used a basis both for public safety decisions and for scientific research. Their configuration affects the data completeness, which in turn, critically affects several seismological scientific targets (e.g., earthquake prediction, seismic hazard...). How to map earthquakes density in seismogenic areas that are not covered by the network? We propose to predict the spatial distribution of earthquakes from the knowledge of presence locations and geological relationships, taking into account any interactions between records. Namely, in a more general setting, we aim to estimate the intensity function of a point process in windows where it has not been observed, conditional to its realization in observed windows, as in geostatistics for continuous processes. We define a predictor as the best linear unbiased combination of the observed point pattern. We show that the weight function associated to the predictor is the solution of a Fredholm equation of second kind. Both the kernel and the source term of the Fredholm equation are related to the second order characteristics of the point process through the pair correlation function. Results are presented and illustrated on simulated nonstationary processes, using continuous covariates or the realization of additional point processes, and real data for mapping Greek Hellenic seismicity in a region with unreliable and incomplete records.

15/01/2021 : Evolution artificielle interactive : comment aborder le participatif ? Évelyne Lutton (MIA/ISC-PIF)

Résumé : La question de l’interaction avec l’humain (sa connaissance, son intuition) est centrale pour les approches d’évolution artificielle interactive (iEC). Sur la base d’exemples personnels, cet exposé tente d’identifier quelques thèmes de recherche émergents, en considérant différents contextes, du mono-utilisateur au multi-utilisateurs. Les questions liées aux développements d’applications participatives semblent particulièrement difficiles et intéressantes.

08/01/2021 : DEX method: recent advances and future challenges on developing predictive models from data Marko Bohanec et Sašo Džeroski (Jožef Stefan Institute, Ljubljana)

Résumé : In the last decade, decision support and data mining approaches have become indispensable tools for researchers and practitioners in agronomy and related fields. Decision modelling is aimed at developing models, usually through collaboration of decision makers and experts, for suggesting and justifying solutions of the problem at hand. Data mining uses data to find meaningful patterns, most often in the form of predictive models, for a similar purpose. Both types of models can be included in decision support systems for aiding decision makers in recurring decision tasks. This seminar will be given through two 30-minute presentations by two senior researchers from Jožef Stefan Institute, Department of Knowledge Technology, Ljubljana, Slovenia: Marko Bohanec, an expert in decision support and creator of DEX method and DEXi software and Sašo Džeroski, an expert in data mining, leading the development of many data mining tools, and Head of the Department. Marko Bohanec will focus on the method DEX and present some recent advances and plans, for instance inclusion of the option generator method in DEXi. Participants who already know DEXi are kindly asked to pose questions and give comments. Sašo Džeroski will present some methods for mining complex data, in particular methods for multi-target prediction. He will also illustrate their use on several problems from ecology and agriculture.

25/12/2020 et 01/12/0202 : Pas de séminaire (vacances scolaires)

18/12/2020 : De l’aide à la décision à l’aide à la réflexion, un glissement paradigmatique… Franck Taillandier (INRAE/RECOVER)

Résumé : Décider est une préoccupation partagée par tous les domaines d’application ; l’étudier, accompagner les gens vers de bons choix est une préoccupation majeure, hier comme aujourd’hui. La recherche scientifique a ainsi investi le champ de l’aide à la décision sous de multiples angles, du plus théorique au plus appliqué. Cela offre un corpus d’une richesse rare et un panel d’outils propres à répondre à de nombreuses problématiques. Mais cela ne va pas sans soulever de questions… Est-on toujours sûr d’utiliser ces outils à bon escient ? Qu’est-ce qu’une bonne décision ou qu’une bonne démarche d’aide à la décision ? D’ailleurs, qu’entend-on par « aide » à la décision ? Ce séminaire n’aura pas vocation à vous apporter toutes les réponses, mais fidèle à la démarche que je prône, à vous faire réfléchir quant à ces questions…

11/12/2020 : Analyse de données spectroscopiques par clustering de variables et réduction de dimension interprétables Rebecca Marion (UCLouvain - Belgique) diaporama

Résumé : En métabolomique, la spectroscopie par résonance magnétique nucléaire (RMN) est un moyen courant de quantifier les concentrations de métabolites. Les spectres RMN sont très reproductibles, ce qui implique que la plupart des variations entre les spectres représentent des différences biologiques entre les échantillons. De plus, comme la spectroscopie RMN peut quantifier des molécules connues et inconnues, elle est particulièrement utile pour identifier et caractériser de nouveaux composés, ce qui en fait une plate-forme importante pour la découverte de biomarqueurs. L'identification des biomarqueurs dans un spectre RMN se résume à l'identification des groupes de variables ou des régions spectrales qui prédisent le mieux le résultat biologique qui nous intéresse. Dans ce séminaire, nous présentons notre nouvelle méthode, Adaptive Clustering around Latent Variables (AdaCLV), qui permet d’identifier de tels clusters de variables de façon non-supervisée. AdaCLV s'inspire des méthodes multivariées existantes de la famille Clustering around Latent Variables (CLV), tout en offrant plusieurs avantages clés par rapport à ces méthodes, tels que sa meilleure précision et son interprétabilité, ainsi que de sa robustesse aux changements de valeurs d’hyperparamètres.

04/12/2020 : Journée des doctorants du pôle IMABS : programme

27/11/2020 : Simulation en recherche médicale. Généralités, exemple et problème connexe. Nicolas Savy (IMT) diaporama

Résumé : Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.

20/11/2020 : Development of decision support systems for application in agronomy. Marko Debeljak (Jožef Stefan Institute, Ljubljana) diaporama

Résumé : Agronomy is increasingly embedded in the broader social and economic context. Its obligations and commitments to meet the objectives of sustainable development goals and ecosystem services are increasing. Due to the rapid development of other fields of research, agronomy is intensively introducing digitisation, which is leading to the accumulation of ever-increasing amounts of data. In parallel with digitisation, extensive informatisation is taking place in agronomy too. It increases the exchange and collection of large amount of knowledge and experiences. Agronomy is in a position where it must make quick and correct decisions about the growing number of problems and expectations of society. Therefore, decision-making in agronomy has become an extremely complex process that can only be managed with an objective scientific approach. Experiences from systems ecology and ecological modelling for the development of decision support systems have proven to be very helpful. The application of methods developed in the field of systems ecology allows us to build a high quality architecture of decision support systems that takes into account the specifics of the agronomic system. The design of a decision support system (DSS) should be a problem driven process. This requires a clear definition and role of all stakeholders which are directly or indirectly involved in the development and application of the DSS. When developing the elements of the DSS structure, the advantages of modern information and computer technology must be used. The structure of the decision models as central elements of the DSS must meet all criteria to ensure their quality and reliability. Decision models must therefore be constructed according to a clearly defined procedure for building ecological models. Any possibility that the DSS might propose wrong decisions that could be the result of a non-functional decision model, must be excluded. In this seminar, I will present the methodology of building decision support systems on three selected cases. The first example is the system for the assessment and management of the risk of surface and groundwater pollution with pesticides, which we developed for ARVALIS - Institut du végétal, France. Another example is the DSS for the simultaneous assessment of five soil functions, which we developed in the H2020 project LANDMARK. The third system, which is still under development, will assess the sustainability of the agronomic value chain based on legumes. We are developing it as part of the H2020 project TRUE. In all systems, the method DEX is used to build qualitative multi-attribute decision models. We complement the existing agricultural expertise with knowledge obtained from data mining. All three decision support systems interact with the users via internet interfaces.

13/11/2020 : Conception et mise en œuvre d’un système modulaire de mini-bioréacteurs pour la culture continue de microorganismes. Cyprien Guérin (Inrae, MaIAGE)

Résumé : Les systèmes de culture continue en bioréacteurs restent, malgré leur intérêt, peu utilisés dans les laboratoires de microbiologie. L’objectif de ce projet de thèse est de faciliter leur mise en œuvre en proposant un nouveau système modulaire de mini-bioréacteurs pilotés par ordinateur en s’appuyant sur les opportunités offertes par l’essor des technologies de fabrication numérique et des microcontrôleurs programmables. Les volumes de culture visés sont de l’ordre de 5 à 10 mL afin de permettre des plans d’expériences complexes pouvant impliquer de nombreux bioréacteurs (en parallèle, en cascade, avec suivi et contrôle en temps réel, ...). Comme preuves de concept, plusieurs applications chez la bactérie Gram-positive Bacillus subtilis sont envisagées aussi bien dans des contextes d’évolution expérimentale et dirigée que pour des études physiologiques s’appuyant sur de la comparaison de transcriptomes.

06/11/2020 : ComMod une posture ! Etienne Delay (CIRAD, GREEN) diaporama

Résumé : Les modèles multi-agents et les jeux de rôles sont des outils de représentation et de simulation du fonctionnement des socio-écosystèmes qui aident à franchir les frontières disciplinaires pour étudier les processus de coordination entre acteurs et de décision collective. Depuis 20 ans l'UPR GREEN au CIRAD les utilisons dans le cadre d’une approche qualifiée de « modélisation d'accompagnement » (companion modeling approach). Cette présentation sera l'occasion de présenter la construction méthodologique de l'approche et ses évolutions à travers mes yeux de « dernier recruté » dans l'unité GREEN. Une occasion de raccrocher ce travail avec des problématiques de gestion des ressources naturelles, de bien commune, et de liens sociaux.

23-30/10/2020 : Pas de séminaire (vacances scolaires)

16/10/2020 : Estimation of species environmental niches and sampling effort from presence only records and illustration on the Pl@ntNet citizen-science flora data. Christophe Botella (LECA)

Résumé: Naturalist mobile applications have been deployed worldwide in the last years and enabled access to a considerable amount of geolocated species presences records. This novel type of data represents a step forward to address ecological and conservation questions through the use of species distribution models (SDMs). However, in the absence of a sampling protocol, the sampling effort often concentrates on specific locations (cities, riverside walks, etc.) located in specific environments, resulting in estimation biases in SDMs. During my PhD, I studied methods to minimize bias in the estimation of inhomogeneous Poisson point processes (IPP) modelling species habitats preferences. I will present two approaches: (i) pooling occurrences from many species, using them as background points in the IPP and conditions under which it yields unbiased estimates, and (ii) the joint modeling of multiple species densities along with a common sampling effort component. Finally, I will show an illustration on Pl@ntNet's citizen science data over the whole French territory, integrating several hundred plant species and hundreds of thousands of observations over France with a highly biased sampling.

09/10/2020 : Model Exploration in Practice. Romain Reuillon (CNRS, ISC-PIF)

Résumé : The use of simulation models has widely spread in recent years, in various fields of academic research. Models are being developed to represent and try to better understand all kinds of systems: population dynamics, epidemics, transportation systems, macro-scale systems, micro-scale systems, etc. In some scientific areas, models and in silico simulations have become essential to help study in vivo situations.
However, simulation models are necessarily a simplification of reality, and hypotheses have to be made when developing a model. Thus every model can (and needs to?) be questioned: Is it relevant to tackle the research question behind it? How to extract significant knowledge from the model? What kind of dynamics can it exhibit? How does each mechanism of the model impact those dynamics? Is every mechanism really necessary? These are just some of the many questions a model developer has to answer in order to really know and understand his/her model!
This talk focuses on the worldwide zombie epidemic of the past few years. It raises the question of what can modelers say about it, and, it attempts to use model exploration, OpenMOLE (openmole.org) and the associated exploration methodology to build knowledge on this forefront phenomenon.

02/10/2020 : Méthodes mathématiques en écologie. Tri Nguyen-Huu (IRD) (diaporama)

Résumé : Le développement de modèles mathématiques ont permis d'apporter un point de vue neuf sur des questions écologiques d'ordre général ou bien appliquées. Des modèles abstraits permettent de mieux comprendre les processus régissant certains écosystèmes, tandis que des modèles plus descriptifs permettent d'avoir une vision plus quantitative des phénomènes étudiés. Nous présenterons quelques modèles mathématiques issus des systèmes dynamiques (équations différentielles, équations aux différences finies) et nous intéresserons à ce qu'ils peuvent apporter à l'étude de quelques problèmes écologiques, à savoir la dynamique bio-économique des pêcheries, la connectivité d'espèces marines récifales, et la conservation des grands herbivores dans les parcs nationaux du Kenya.

25/09/2020 : Learning with pangenomes. Laurent Jacob (CNRS, LBBE)

Résumé : As the number and variety of sequenced genomes grows, representing them by comparison to a single reference leads to an increasing level of approximation, discarding accessory genes, rearrangements and repeated regions. This problem is particularly acute when studying microbial genomes or metagenomes, and hinders essential statistical tasks such as GWAS or prediction in this context. I will discuss genome representations which are well suited to statistical analysis when genomes are ill-suited to alignment or even assembly.

18/09/2020 : Partager de l'information pour faire face à un virus. Etude de cas en ostréiculture via un modèle multi-agent. Nicolas Paget (CIRAD)

Résumé : Le postulat selon lequel le partage d'information permet de meilleures prises de décisions est fortement ancré. En développant un modèle multi-agent sur la plateforme Cormas, nous avons questionné ce postulat. Depuis quelques années, les ostréiculteurs font face à un virus (os-hv1) au fort taux de létalité. Ce virus n'est que mal connu. Dans le modèle, les agents, de rationalités variées, partagent leurs expériences et en tirent des leçons pour leurs pratiques. Nous étudions alors le type de décision prise par les agents en fonction de scénarios de partage de l'informations et d'hétérogénéité des agents. Les résultats montrent que l'hétérogénéité des agents permet une meilleure exploration de l'espace des possibles et qu'un partage et une interprétation trop radicaux des expériences de chacun à un effet contreproductif. Ce travail a été effectué en thèse. Lors de cette présentation, j'évoquerai aussi des travaux ou pistes de travaux plus récents ou en cours d'initialisation dans l'idée de susciter des collaborations.

11/09/2020 : Thigmoimmunité végétale. Comment la mécanoperception participe à la réponse immunitaire. Adelin Barbacci (LIPM)

Résumé : Les attaques de parasites sont responsables chaque année de pertes de récolte considérables à travers le monde. La recherche de sources génétiques de résistance durable chez les plantes constitue un levier important pour répondre à la demande alimentaire mondiale. Sclerotinia sclerotiorum est le champignon pathogène responsable de la maladie de la pourriture blanche sur plus de 400 espèces végétales, causant plusieurs millions d’euros de pertes de récolte chaque année, notamment sur colza. Comme la majorité des agents pathogènes, S. sclerotiorum utilise la sécrétion de molécules effectrices pour manipuler la physiologie des plantes hôtes et favoriser son développement. La mise en place de la QDR est consécutive à la perception du champignon. Toutefois, contrairement à la résistance gène-pour-gène plus largement étudiée, la QDR mobilise de nombreux réseaux de gènes qui sont encore méconnus et ne sont pas tous spécifiquement dédiés à l’immunité. Or, l'interaction plante-champignon met en jeu des signaux mécaniques importants, intrinsèques à la pénétration des tissus de l’hôte.
Au cours de ces deux dernières années nous avons réussi à montrer que les signaux mécaniques jouent un rôle de premier plan dans la mise en place de la réponse immunitaire et qu’il était possible de moduler fortement le niveau de résistance des plantes grâce à des ondes mécaniques. Ce travail est le fruit d’une collaboration étroite entre des équipes de physique (Aroune Duclos Laboratoire d’Acoustique de l’Université du Mans), de physiologie végétale (Nathalie Leblanc-Fournier INRA PIAF Clermont, Tou-Cheu Xiong INRA BPMP Montpellier) de biologie moléculaire (Adelin Barbacci LIPM) et de modélisation mathématique et informatique (Frédérick Garcia MIAT). C’est également le point de départ de la thèse de Khaoula Hadj-Amor coencadrée par MIAT et le LIPM. L’exposé s’attachera à présenter nos aventures entre mécanoperception, proprioception et réponse immunitaire.

Séminaires reportés à une date ultérieure

KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows. Benjamin Charlier (Université de Montpellier, ARAMIS)

Résumé : The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula. It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU. KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
Web site: http://www.kernel-operations.io

Séminaires passés / Past seminars

Lien vers la Liste des séminaires passés de l'unité MIAT.

Contacts

Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter Nathalie Vialaneix ou Sandra Plancade.

Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels