Séminaires : Différence entre versions

De MIAT INRA
Aller à : navigation, rechercher
(01/03/2021 à 15h : Soutenance de thèse Manon Ruffini)
 
(328 révisions intermédiaires par 6 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
= Séminaires de l'unité MIAT : =
+
 
 +
= Séminaires de l'unité MIAT =
  
 
[[File:Pyrenees-morning.jpg|thumb|center|800px|Pyrenees-morning.jpg]]
 
[[File:Pyrenees-morning.jpg|thumb|center|800px|Pyrenees-morning.jpg]]
  
Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.  
+
Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.
 +
 
 +
Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué [[Accès_MIAT|ici]] (nous sommes à moins de 30 mètres de la réception&nbsp;!). <!--The seminar of the MIAT Unit of the INRA in Toulouse is a place for scientific and technical exchanges between members of the unit and experts in mathematics, computer science,&#160;agro-ecosystems, bioinformatics ''etc.'' Talks can be on mature ongoing working subjects, on finalized highly specialized projects or have a more informative/educational scope. The focus can be on methodological aspects as well as on applications. Some presentations during other local seminars can be flagged as highly interesting to the usual audience of the MIAT seminar.
 +
Presentations can be either in English or in French. According to the presentation, a typical seminar lasts from 45min to a couple of hours. Unless otherwise stated, it is held in the MIAT meeting room at 10.30 on Fridays. Acces to the INRA Auzeville/Castanet, MIAT unit is indicated [[Accès_MIAT|here]] (we're less than 30 meters from the reception&#160;!). -->
 +
 
 +
 
 +
== Séminaires de l'année en cours et séminaires futurs ==
 +
 
 +
 
 +
==== 25/06/2021&nbsp;: ====
 +
 
 +
==== 18/06/2021&nbsp;: ====
 +
 
 +
==== 11/06/2021&nbsp;: ====
 +
 
 +
==== 04/06/2021&nbsp;: Séminaire interne : Record ====
 +
 
 +
==== 28/05/2021&nbsp;:  ''Titre à venir.'' Magali Berland (MetaGenoPolis, INRAE) ====
  
Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi.
+
==== 21/05/2021&nbsp;: ''Classer la migration à l'ère du Big Data. Est-il possible d'identifier le comportement de migration par des routines automatiques ? Performance de 3 méthodes, MigrO, MigrateR et une approche de segmentation'' [https://www6.toulouse.inrae.fr/cefs/PERSONNELS/Permanents/Debeffe-Lucie Lucie Debeffe] (INRAE, CEFS) ====
L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué [[Accès_MIAT|ici]] (nous sommes à moins de 30 mètres de la réception&nbsp;!).
 
  
<!--The seminar of the MIAT Unit of the INRA in Toulouse is a place for scientific and technical exchanges between members of the unit and experts in mathematics, computer science,&nbsp;agro-ecosystems, bioinformatics ''etc.'' Talks can be on mature ongoing working subjects, on finalized highly specialized projects or have a more informative/educational scope. The focus can be on methodological aspects as well as on applications. Some presentations during other local seminars can be flagged as highly interesting to the usual audience of the MIAT seminar.
+
==== 14/05/2021&nbsp;: ====
Presentations can be either in English or in French. According to the presentation, a typical seminar lasts from 45min to a couple of hours. Unless otherwise stated, it is held in the MIAT meeting room at 10.30 on Fridays. Acces to the INRA Auzeville/Castanet, MIAT unit is indicated [[Accès_MIAT|here]] (we're less than 30 meters from the reception&nbsp;!). -->
 
  
 +
==== 07/05/2021&nbsp;:  Séminaire interne : SciDyn====
  
 +
==== 23/04/2021 et 30/04/2021 &nbsp;: Pas de séminaire (vacances scolaires) ====
  
 +
==== 16/04/2021&nbsp;: ''Optimal convergence rates for Nesterov acceleration.'' [https://perso.math.univ-toulouse.fr/rondepierre/ Aude Rondepierre] (INSA/IMT) ====
  
 +
:'''Résumé&nbsp;:''' In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
 +
:This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.
  
 +
==== 09/04/2021&nbsp;: ''Titre à venir.'' Estelle Kuhn (MaIAGE, INRAE)====
  
 +
==== 02/04/2021&nbsp;: Séminaire interne : SAAB ====
  
 +
==== 26/03/2021&nbsp;:  "Titre à venir" Christophe Denis (LAMA, Université Paris-Est Marne-la-Vallée)====
  
 +
==== 19/03/2021&nbsp;:  "Titre à venir" Vincent Rocher (CBI, Université Paul Sabatier) ====
  
== Séminaires de l'année en cours et séminaires futurs &nbsp;: ==
+
==== 12/03/2021&nbsp;: Séminaire interne : Clément Birbes (plateforme bio-info) ====
  
*12/04/2019&nbsp;: ''Titre à venir''. [https://www6.toulouse.inra.fr/toxalim_eng/Research-Teams/E2-MeX-Metabolism-of-Xenobiotics/Research/Metabolic-Networks Nathalie Poupin] (INRA Toulouse, Toxalim)  
+
==== 05/03/2021 exceptionnellement à 11h&nbsp;: ''Pourquoi et comment réduire les émissions de gaz à effet de serre du secteur de la recherche en France ? L’approche bottom up proposée par Labos 1point5.'' [https://gael.univ-grenoble-alpes.fr/membres/odile-blanchard Odile Blanchard] (GAEL, Université de Grenoble) ====
  
*29/03/2019&nbsp;: ''Titre à venir''. [https://www6.bordeaux-aquitaine.inra.fr/sante-agroecologie-vignoble/Personnel/Scientifiques/Frederic-Fabre Frédéric Fabre] (INRA Bordeaux, SAVE) '''Séminaire [https://www6.inra.fr/imabs/ IMABS]'''
+
:'''Résumé&nbsp;:''' La France s’est engagée à la neutralité carbone à l’horizon 2050. Cela signifie que les émissions de gaz à effet de serre de la France doivent diminuer fortement, de façon très rapide, pour atteindre zéro émissions nettes en 2050.
 +
:Le séminaire vise d’une part à discuter pourquoi le secteur de la recherche doit contribuer à la réduction des émissions de gaz à effet de serre de la France et d’autre part à exposer comment le collectif Labos 1point5 s’est emparé de la question depuis 2 ans au sein de la communauté scientifique française.  
 +
:Le séminaire sera l’occasion de présenter le collectif Labos 1point5, ses objectifs, sa structuration, ses travaux. Un temps particulier sera consacré à l’outil d’estimation des émissions de gaz à effet de serre des laboratoires, GES 1point5. Développé par le collectif dans une démarche bottom up, GES 1point5 permet à la fois de définir des plans d’actions pour réduire les émissions de gaz à effet de serre des laboratoires, de mener des expérimentations dans ce domaine dans les laboratoires, et d’engager des travaux de recherche sur l’empreinte carbone de la recherche.
  
*15/03/2019&nbsp;: ''Titre à venir''. Joon Kwon (MIA Paris).
+
==== 05/03/2021 à 10h&nbsp;: ''Soutenance de thèse de Jelena Vucinic'' : Modélisation moléculaire et Intelligence Artificielle pour le design computationnel de protéines: conception d'enzymes optimisées et de nano-anticorps ====
  
'''Pas de séminaire le 1er et 8 mars (vacances scolaires)'''
+
==== 01/03/2021 à 15h&nbsp;: ''Soutenance de thèse Manon Ruffini'' : Modèles et méthodes pour les problèmes de design de protéines multi-états ====
  
*15/02/2019&nbsp;: ''Au-delà des conteneurs&nbsp;: Environnements logiciels reproductibles avec GNU Guix''. [http://people.bordeaux.inria.fr/lcourtes/ Ludovic Courtès] (INRIA Bordeaux, SED).
+
==== 19/02/2021 et 26/02/2021&nbsp;: Pas de séminaire (vacances scolaires) ====
  
:
+
==== 12/02/2021&nbsp;: ''A metagenomic-data-based model of the gut microbiota'' Simon Labarthe (INRAE/MaIAGE) ====
::'''Résumé&nbsp;:''' La reproductibilité des expériences impliquant du logiciel est un enjeu scientifique majeur. Docker et Singularity peuvent répliquer un environnement logiciel mais permettent difficilement d’aller au-delà et d’expérimenter. Peut on concilier reproductibilité et expérimentation pour les environnements logiciels&nbsp;? GNU&nbsp;Guix est comparable à apt-get, yum ou CONDA, mais il fournit des binaires reproductibles et un suivi de leur provenance. Il peut aider à la gestion d’environnements comme VirtualEnv ou encore provisionner des conteneurs. J’évoquerai notre expérience avec Guix en calcul intensif (HPC) et son positionnement par rapport à des outils comme Singularity ou EasyBuild. Enfin j'expliquerai comment nous cherchons à intégrer la notion de déploiement au cœur d’applications telles que Jupyter ou les outils de gestion de pipelines. Liens&nbsp;: [https://guix-hpc.bordeaux.inria.fr/ https://guix-hpc.bordeaux.inria.fr/] et [https://gnu.org/s/guix https://gnu.org/s/guix] 
 
  
*8/02/2019&nbsp;:&nbsp;''Titre à venir''. [https://www6.toulouse.inra.fr/agir/Les-equipes/VASCO/Membres/Pierre-Casadebaig Pierre Casadebaig] (UMR AGIR, INRA Toulouse).  
+
:'''Résumé&nbsp;:''' The human gut harbors a complex bacterial community, the gut microbiota, that maintains a symbiotic relationship with its host: the microbiota ecology is then linked to the host’s health. Mathematical models of the microbial population dynamics are therefore a promising tool to study the mechanisms driving the homeostasis or the dysbiosis of the microbiota, and the links with pathologies.
*1/02/2019&nbsp;:&nbsp;''Sociétés rurales du passé et du présent&nbsp;: Une approche par Modélisation sociale multi-agents spatialisée''. Medhi Saqalli (UMR GEODE, CNRS).  
+
:We couple a PDE population dynamics model of functional microbial meta-populations involved in fibre degradation to a fluid mechanic model of the intestinal content. The metabolic capabilities of the meta-populations are inferred from functional metagenomic data through NMF (non-negative matrix factorization). Metabolic models of the meta-populations are built to predict the metabolite consumptions and the growth rates, and are plugged to the PDE population dynamics model to account for the interactions between the bacterial populations and the intestinal environment. Furthermore, the taxonomic composition of the meta-populations is derived from an additional non-negative least square problem regressing taxonomic marker gene counts against the weight matrix resulting from the previous NMF. This approach makes possible direct comparisons between the model outputs and both gene (shotgun) or bacterial (16s) counts.
 +
:''This work is a collaboration with B. Laroche, and with M. Ribot, B. Polizzi, T. Phan and T. Goudon for the population/fluid dynamics model of the microbiota and its environment, and with L. Darrigade and M.Leclerc for the metapopulation construction.''
  
:
+
==== 05/02/2021&nbsp;: '''Journée reproductibilité''' dans le cadre des animations IMABS programme à [https://www6.inrae.fr/imabs/Evenements/Seminaires/Journee-Reproductibilite-de-la-Recherche ce lien] ====
::'''Résumé&nbsp;:''' Cette présentation traite de la démarche élaborée pour la reconstitution des socio-écosystèmes au sens de Elinor Ostrom, à savoir la combinaison populations et règles sociales d’une part, territoire et environnement d’autre part, qui interagissent par l’intermédiaire des aménités et services écosystémiques qui les relient et en particulier via les systèmes agraires.&nbsp;<span style="text-align: justify;">Nous présentons plusieurs exemples d’application actuels (dynamiques sociales, modes d’organisation familiale et héritages au Sahel nigérien&nbsp;; contamination pétrolière et colonisation de l’Amazonie équatorienne) et passés (populations et systèmes agraires de la culture rubanée sur les 1000 ans entourant l’expansion et la disparition finale de cette culture sur l’Europe tempérée).&nbsp;</span><span style="text-align: justify;">La construction de ces modélisations multi-agents spatialisées passe par la formalisation des paramètres environnementaux et agro-zootechniques mais aussi des règles socio-anthropologiques et économiques qui, fonctionnant et s’adaptant aux mailles les plus petites, sociales (la famille et l’individu), temporelle (la saison, le mois voire la semaine) et spatiale (l’hectare le plus souvent) et évoluant selon les conditions du milieu local (écologie, dynamique passée, démographie) permettent de reconstituer des dynamiques sociales et spatiales passées mais aussi, pour l’actuel, d’envisager une exploration de la résilience des systèmes et de la prospective sur leurs futurs, au travers de scénarios dont la légitimité est toujours à formaliser collectivement.</span><br/> &nbsp; 
 
  
*<span style="text-justify:inter-ideograph">25/01/2019&nbsp;: ''Développements récents et ouvertures pour la détection de segments atypiques au sein de séquences''. [https://perso.math.univ-toulouse.fr/mercier/ Sabine Mercier] (UT2J, IMT).</span>
+
==== 29/01/2021&nbsp;: ''Developing an ontological framework for facilitating the exploitation and re-use of phenomics data based on a formalisation of numerical relationships'' [https://www6.montpellier.inrae.fr/lepse/Organisation/Equipe-M3P-Dev/Luis-Felipe-Vargas-Rojas/ Luis-Felipe Vargas-Rojas] (LEPSE, INRAE) ====
  
:
+
:'''Résumé&nbsp;:''' In recent years, plant phenomics has produced massive datasets involving experiments performed in the field and controlled conditions, concerning hundreds of genotypes at different scales of organisation. Taken together, these datasets are unprecedented resources for identifying and testing novel mechanisms and models (Tardieu et al., 2017). Assembling and organising such datasets is not straightforward because of the heterogeneous, multi-scale and multi-source nature of data, to deal partially with these issues, the phenomics community has proposed an ontology-driven Information System (PHIS, www.phis.inra.fr, Neveu et al., 2019) based on FAIR principles (Wilkinson et al., 2016). However, exploitation and re-use of these datasets have not reached its full potential because (1) metadata is often merely informative, (2) relationships between numerical attributes are poorly formalised, whereas (3) ontological reasoning is more efficient for representing categorical data. For instance, relationships such as unit conversion are not effectively used, even if the data is well-annotated and information to perform the computation is provided by unit ontologies (OM, QUDT). The goal of the thesis is to create an ontological framework for representing and computing different kinds of numerical relationships for plant phenomics attributes. It will focus on equations representing most current variables and data-manipulation processes in  plant phenomics (e.g. unit conversions, thermal time, and phyllochron). For each use-case, details about metadata, context-dependencies, links between domain-specific ontologies and the formalisation of the equation structure, will be presented. Finally, the concrete machinery to perform these context-aware computations and an effective information retrieval, meant to reduce the user's time-effort and the query definition complexity, will be proposed.
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Nous commencerons par définir le score local et présenter le contexte historique des travaux théoriques sur sa distribution. Deux résultats récents seront ensuite développés. Une approximation asymptotique de la loi du score local pour une chaîne de Markov, améliorant les résultats de Karlin et Dembo de 1992 ''passés sous silence'', sera tout d'abord présentée. Nous proposons ensuite de probabiliser l'espace de tous les segments possibles, optimaux et sous optimaux, sans se limiter aux segments réalisant le score local&nbsp;; de mettre cet espace en relation avec celui provenant naturellement de l'utilisation des chaînes de Markov cachées. Cette dualité permet alors un transfert de compétences pour la détection de segments atypiques. Les ouvertures prometteuses de ces travaux, ainsi que les résultats sur le score local de manière générale, seront abordées&nbsp;: application en Maîtrise statistique des Procédés&nbsp;; inférence sur le score local&nbsp;; approximation du nombre de régions de scores dépassant un seuil donné&nbsp;; test multiple...</span> 
 
  
*<span style="text-justify:inter-ideograph">18/01/2019&nbsp;: ''Classification des essences arborées à partir de séries temporelles d'images satellitaires''. [http://www.ensat.fr/fr/formations/les-enseignants/david-sheeren.html David Sheeren] (ENSAT, Toulouse).</span>
+
==== 22/01/2021&nbsp;: ''Predicting the intensity function of point processes  beyond observation areas.'' [http://edith.gabriel.pagesperso-orange.fr/ Edith Gabriel] (INRAE/BioSP) ====
*<span style="text-justify:inter-ideograph">11/01/2019&nbsp;:&nbsp;''Argumentation Reasoning''.&nbsp;[https://www.irit.fr/~Sylvie.Doutre/ Sylvie Doutre](Université Toulouse 1, UMR IRIT).</span>
 
  
:
+
:'''Résumé&nbsp;:''' Seismic networks provide data that are used a basis both for public safety decisions and for scientific research. Their  configuration  affects the data completeness, which in turn, critically affects several seismological scientific targets (e.g., earthquake prediction, seismic hazard...). How to map earthquakes density in seismogenic areas that are not covered by the network? We propose to predict the spatial distribution of earthquakes from the knowledge of presence locations and geological relationships, taking into account any interactions between records. Namely, in a more general setting, we aim to estimate the intensity function of a point process in windows where it has not been observed, conditional to its realization in observed windows, as in geostatistics for continuous processes. We define a predictor as the best linear unbiased combination of the observed point pattern. We show that the weight function associated to the predictor is the solution of a Fredholm equation of second kind. Both the kernel and the source term of the Fredholm equation are related to the second order characteristics of the point process through the pair correlation function. Results are presented and illustrated on simulated nonstationary processes, using continuous covariates or the realization of additional point processes, and real data for mapping Greek Hellenic seismicity in a region with unreliable and incomplete records.
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Abstract argumentation is an elegant way to tackle reasoning problems in presence of conflicting information. This reasoning model finds applications in various domains such as medicine, law, or agriculture. The seminal paper by Dung defines an argumentation framework as a digraph whose nodes are abstract entities called arguments, and edges are attacks representing the conflicts between these arguments. Several acceptability semantics allow to decide which sets of arguments are accepted, depending on the properties which are expected to be satisfied by a set of arguments to be a rational “outcome” of the framework. Numerous enrichments of Dung’s framework have been proposed, for example, to take into account some supports between arguments besides the attacks, or some preferences between arguments. This talk presents some of these formal frameworks, and addresses a challenging issue that has been addressed in the past few years in this context: the dynamics of abstract argumentation settings</span> 
 
  
*<span style="text-justify:inter-ideograph">'''Exceptionnellement mardi''' 8/01/2019&nbsp;: ''Une méta-analyse transcriptomique identifie une réponse globale aux stress chez la plante modèle Arabidopsis''. [https://www6.inra.fr/mia-paris/Equipes/Membres/Marie-Laure-Martin-Magniette Marie-Laure Martin-Magniette] (MIA Paris & IPS2).</span>
+
==== 15/01/2021&nbsp;: ''Evolution artificielle interactive : comment aborder le participatif ?'' [http://evelyne.lutton.free.fr/ Évelyne Lutton] (MIA/ISC-PIF) ====
  
:
+
:'''Résumé&nbsp;:''' La question de l’interaction avec l’humain (sa connaissance, son intuition) est centrale pour les approches d’évolution artificielle interactive (iEC). Sur la base d’exemples personnels, cet exposé tente d’identifier quelques thèmes de recherche émergents, en considérant différents contextes, du mono-utilisateur au multi-utilisateurs. Les questions liées aux développements d’applications participatives semblent particulièrement difficiles et intéressantes.
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La réponse des plantes aux stress est contrôlée par de nombreux réseaux d’interactions moléculaires. Au niveau transcriptomique, ces réseaux peuvent être explorés par des approches de «&nbsp;coupable par association&nbsp;» pour identifier des modules fonctionnels contrôlant la physiologie de la plante. La quantité des jeux transcriptomiques disponibles dans les bases de données publiques internationales constituent une ressource génomique importante mais leur diversité peut également être considérée comme une limitation pour des méta-analyses car les jeux de données peuvent être très hétérogènes dans leur construction. Pour limiter cet inconvénient, dans notre projet, nous avons considéré presque 400 comparaisons transcriptomiques décrivant des réponses aux stress de la plante modèle Arabidopsis thaliana, toutes produites au cours des 15 dernières années par la plateforme de notre institut avec des protocoles standardisés (Gagnot et al (2008) NAR 36:D986-90). Ces comparaisons ont été divisées en 18 catégories (9 stress biotiques et 9 stress abiotiques) et pour chaque catégorie, nous avons identifié des groupes de gènes co-exprimés à l’aide d’un modèle de mélange gaussien. Au total, 634 groupes de co-expression ont été identifiés et leur annotation a montré de nombreux enrichissements fonctionnels. Tous les résultats par catégorie de stress sont disponibles dans le module GEM2Net ([https://tools.ips2.u-psud.fr/GEM2NET https://tools.ips2.u-psud.fr/GEM2NET]) de la base de données CATdb (Zaag et al (2015) NAR 43:D1010–D1017). Les analyses de co-expression étant faites par catégorie de stress, nous les avons ensuite intégrées pour construire à l’aide de modèle de mélange de graphes un réseau de co-régulation impliquant 2274 gènes regroupés en 43 communautés stables. Une analyse topologique de ce réseau de co-régulation a permis d’identifier 4 grandes fonctions biologiques et une organisation hiérarchique entre ces 4 grandes fonctions qui est la réponse globale aux stress des plantes. L’objectif de cet exposé est de présenter les différentes étapes de ce projet, la méthodologie employée et l’apport de la modélisation statistique.</span> 
 
  
<span style="text-justify:inter-ideograph">'''Pas de séminaire le 28 décembre, ainsi que le 4 janvier (vacances scolaires)'''</span>
+
==== 08/01/2021&nbsp;: ''DEX method: recent advances and future challenges on developing predictive models from data'' [http://kt.ijs.si/MarkoBohanec/mare.html Marko Bohanec] et [http://kt.ijs.si/SasoDzeroski/ Sašo Džeroski] (Jožef Stefan Institute, Ljubljana) ====
  
*<span style="text-justify:inter-ideograph">21/12/2018 '''exceptionnellement à 14h'''&nbsp;: ''Retour sur ANITI, le projet d'Institut Interdisciplinaire d'Intelligence Artificielle''. [https://mia.toulouse.inra.fr/Frédérick_GARCIA Frédérick Garcia] (MIAT).</span>
+
:'''Résumé&nbsp;:''' In the last decade, decision support and data mining approaches have become indispensable tools for researchers and practitioners in agronomy and related fields. Decision modelling is aimed at developing models, usually through collaboration of decision makers and experts, for suggesting and justifying solutions of the problem at hand. Data mining uses data to find meaningful patterns, most often in the form of predictive models, for a similar purpose. Both types of models can be included in decision support systems for aiding decision makers in recurring decision tasks. This seminar will be given through two 30-minute presentations by two senior researchers from Jožef Stefan Institute, Department of Knowledge Technology, Ljubljana, Slovenia: Marko Bohanec, an expert in decision support and creator of DEX method and DEXi software and Sašo Džeroski, an expert in data mining, leading the development of many data mining tools, and Head of the Department. Marko Bohanec will focus on the method DEX and present some recent advances and plans, for instance inclusion of the option generator method in DEXi. Participants who already know DEXi are kindly asked to pose questions and give comments. Sašo Džeroski will present some methods for mining complex data, in particular methods for multi-target prediction. He will also illustrate their use on several problems from ecology and agriculture.
  
*<span style="text-justify:inter-ideograph">14/12/2018&nbsp;: ''Les temps de coalescence pour trois gènes permettent de&nbsp;distinguer entre changement de taille et structure''. [https://www.math.univ-toulouse.fr/~grusea/ Simona Grusea] (INSA Toulouse).</span>
+
==== 25/12/2020 et 01/12/0202&nbsp;: Pas de séminaire (vacances scolaires) ====
  
:
+
==== 18/12/2020&nbsp;: ''De l’aide à la décision à l’aide à la réflexion, un glissement paradigmatique…'' [https://www6.paca.inrae.fr/recover_eng/Laboratory-s-members/Social-Pages/Franck-TAILLANDIER Franck Taillandier] (INRAE/RECOVER) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La quantité croissante de données génomiques actuellement disponibles élargit les horizons de l'inférence en génétique des populations. Un large éventail de méthodes a été publié permettant de détecter et de dater les changements majeurs dans la taille d'une population au cours de l'histoire de l'espèce. En même temps, il est de plus en plus reconnu que la structure d'une population peut générer des données génétiques similaires à celles générées dans les modèles de changement de taille. Récemment, nous avons montré que, quel que soit le modèle de structure de population, il est toujours possible de trouver un modèle panmictique, avec une fonction particulière de changement de taille, ayant une distribution identique de Tk (le premier temps de coalescence pour un échantillon de taille k). Cela implique que l'on ne peut pas distinguer entre un modèle panmictique et un modèle structuré lorsque nous basons notre analyse uniquement sur un seul temps de coalescence. Je présenterai dans cet exposé un travail récent dans lequel, basé sur une étude analytique de la matrice de taux du processus des lignées ancestrales, nous obtenons de nouveaux résultats théoriques sur la distribution jointe des temps de coalescence T3 et T2 pour un échantillon de trois gènes dans une modèle à n îles symétrique. En particulier, nous montrons que cette distribution est toujours différente de celle obtenue dans une population panmictique, quel que soit le scénario de changement de taille de population. La distribution jointe des temps de coalescence (T3, T2) pour un échantillon de trois gènes contient donc suffisamment d'information pour permettre de distinguer entre une population panmictique et un modèle à n îles symétrique.</span> 
 
  
*<span style="text-justify:inter-ideograph">07/12/2018&nbsp;: ''Recent algorithmic advances for combinatorial optimization in graphical models''. [http://www7.inra.fr/mia/T/degivry/ Simon de Givry] (MIAT).</span>
+
:'''Résumé&nbsp;:''' Décider est une préoccupation partagée par tous les domaines d’application ; l’étudier, accompagner les gens vers de bons choix est une préoccupation majeure, hier comme aujourd’hui. La recherche scientifique a ainsi investi le champ de l’aide à la décision sous de multiples angles, du plus théorique au plus appliqué. Cela offre un corpus d’une richesse rare et un panel d’outils propres à répondre à de nombreuses problématiques. Mais cela ne va pas sans soulever de questions… Est-on toujours sûr d’utiliser ces outils à bon escient ? Qu’est-ce qu’une bonne décision ou qu’une bonne démarche d’aide à la décision ? D’ailleurs, qu’entend-on par « aide » à la décision ? Ce séminaire n’aura pas vocation à vous apporter toutes les réponses, mais fidèle à la démarche que je prône, à vous faire réfléchir quant à ces questions…
  
:
+
==== 11/12/2020&nbsp;: Analyse de données spectroscopiques par clustering de variables et réduction de dimension interprétables [https://uclouvain.be/fr/repertoires/rebecca.marion/   Rebecca Marion] (UCLouvain - Belgique) [https://sites.google.com/view/rebeccamarion/presentations diaporama] ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' By representing the constraints and objective function in fac-torized form, graphical models can concisely define various NP-hard combinatorial optimization problems. They are therefore extensively used in several areas of computer science and artificial intelligence. Graphical models can be deterministic or stochastic, optimize a sum or product of local functions, defining a joint cost or probability distribution. Simple transformations exist between these two types of models, but also with MaxSAT and integer programming. During the past ten years, we have been developing a graphical model solver called toulbar2 and we report on a large comparison of exact solvers which are all state-of-the-art for their own target language. We present recent algorithmic advances in toulbar2 including generalized clique cuts and parallel variable neighborhood search methods that make the solver very competitive on several benchmarks coming from probabilistic inference, computer vision and pattern recognition, weighted MaxSAT, and weighted MaxCSP competitions. Solver toulbar2 is available at [http://www.inra.fr/mia/T/toulbar2 http://www.inra.fr/mia/T/toulbar2].</span> 
 
  
*<span style="text-justify:inter-ideograph">30/11/2018&nbsp;: ''Inférence de traits fonctionnels à partir de données métagénomiques par NMF.'' [http://genome.jouy.inra.fr/~splancade/ Sandra Plancade] (INRA MAIAGE, ISBA Louvain)</span>
+
:'''Résumé&nbsp;:''' En métabolomique, la spectroscopie par résonance magnétique nucléaire (RMN) est un moyen courant de quantifier les concentrations de métabolites. Les spectres RMN sont très reproductibles, ce qui implique que la plupart des variations entre les spectres représentent des différences biologiques entre les échantillons. De plus, comme la spectroscopie RMN peut quantifier des molécules connues et inconnues, elle est particulièrement utile pour identifier et caractériser de nouveaux composés, ce qui en fait une plate-forme importante pour la découverte de biomarqueurs. L'identification des biomarqueurs dans un spectre RMN se résume à l'identification des groupes de variables ou des régions spectrales qui prédisent le mieux le résultat biologique qui nous intéresse. Dans ce séminaire, nous présentons notre nouvelle méthode, Adaptive Clustering around Latent Variables (AdaCLV), qui permet d’identifier de tels clusters de variables de façon non-supervisée. AdaCLV s'inspire des méthodes multivariées existantes de la famille Clustering around Latent Variables (CLV), tout en offrant plusieurs avantages clés par rapport à ces méthodes, tels que sa meilleure précision et son interprétabilité, ainsi que de sa robustesse aux changements de valeurs d’hyperparamètres.
  
:
+
==== 04/12/2020&nbsp;: ''Journée des doctorants du pôle IMABS : [https://miat.inrae.fr/site/images/3/31/ProgrammeSeminaireDoctorants.pdf programme]'' ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La métagénomique étudie le matériel génétique d'un écosystème bactérien, qui désigne l'ensemble des bactéries présentes dans un milieu donné, dans le but de caractériser l'écosystème et les fonctions qui y sont réalisées, ainsi que leur association avec des phénotypes. Dans ce contexte, la NMF (Nonnegative Matrix Factorization), une technique de réduction de dimension sous contraintes de positivité, permet simultanément la comparaison d'échantillons biologiques et l'inférence de structures existantes dans l'écosystème. Dans cet exposé, je présenterai une méthode d'exploration des voies métaboliques associées au processus de digestion des fibres, à partir de mesures métagénomiques dans l'intestin. Cette approche s’appuie sur la construction préalable d’une liste de traits fonctionnels élémentaires caractérisés par un groupe de gènes microbiens, à partir d’une base d’annotation fonctionnelle rassemblant des connaissances biologiques. Une matrice d'abondances en traits fonctionnels pour un ensemble d’individus est alors calculée à partir de mesures métagénomiques. Le modèle biologique considéré suppose l’existence de voies métaboliques caractérisées par une proportion en chacun des traits fonctionnels, et de profils métaboliques individuels définis par une composition en chacune des voies, ce qui correspond à une décomposition NMF. La modélisation est complétés par des contraintes permettant l'inclusion de connaissances biologiques et biochimiques.</span> 
 
  
*<span style="text-justify:inter-ideograph">23/11/2018&nbsp;: ''Viability theory and management of sustainability.&nbsp;'' [http://motive.cemagref.fr/people/guillaume.deffuant Guillaume Deffuant] (IRSTEA, LISC)</span>
+
==== 27/11/2020&nbsp;: ''Simulation en recherche médicale. Généralités, exemple et problème connexe.'' [https://perso.math.univ-toulouse.fr/savy/ Nicolas Savy] (IMT) [https://miat.inrae.fr/site/images/3/36/SEMINAIRE_INRAe_SAVY.pdf diaporama] ====
  
:
+
:'''Résumé&nbsp;:''' Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' This talk introduces viability theory and its potential in the management of sustainability. Viability theory addresses the problem of maintaining a dynamical system within a given subset of states, generally called the constraint set. Instead of optimising a criterion, the control strategy thus aims at avoiding crossing the limits of this constraint set. In the case of deterministic dynamics, the main theoretical concept of this theory is the viability kernel. This set includes all states from which there exists a control strategy maintaining the system indefinitely in the constraint set. Different viable control policies can be derived from the viability kernel, which makes this set of high practical interest. The viability kernel has also been used in a mathematical definition of resilience: the resilient states are the ones from which the viability kernel is reachable. Recently, this theory has been completed by other types of sets in a general theory of sustainable management, when making the hypothesis that standard or emergency controls can be applied depending on the situation. The practical application of these theories depends on the algorithms approximating viability kernels and reachable sets, which, unfortunately, face the famous dimensionality curse. The talk finally reports recent progress in improving these algorithms and some remaining challenges.</span> 
 
  
*<span style="text-justify:inter-ideograph">16/11/2018&nbsp;: ''How much maths does a biologist need, and vice versa?'' [https://people.csiro.au/R/T/Toni-Reverter-Gomez Toni Reverter-Gomez] (CSIRO, Australie) '''en salle de conférence Marc Ridet'''</span>
+
==== 20/11/2020&nbsp;: ''Development of decision support systems for application in agronomy''. [http://landmark2020.eu/member/marko-debeljak/ Marko Debeljak] (Jožef Stefan Institute, Ljubljana) [https://miat.inrae.fr/site/images/8/8a/2020_11_20_INRAe_Debeljak.pdf diaporama] ====
  
:
+
:'''Résumé'''&nbsp;: Agronomy is increasingly embedded in the broader social and economic context. Its obligations and commitments to meet the objectives of sustainable development goals and ecosystem services are increasing. Due to the rapid development of other fields of research, agronomy is intensively introducing digitisation, which is leading to the accumulation of ever-increasing amounts of data. In parallel with digitisation, extensive informatisation is taking place in agronomy too. It increases the exchange and collection of large amount of knowledge and experiences. Agronomy is in a position where it must make quick and correct decisions about the growing number of problems and expectations of society. Therefore, decision-making in agronomy has become an extremely complex process that can only be managed with an objective scientific approach. Experiences from systems ecology and ecological modelling for the development of decision support systems have proven to be very helpful. The application of methods developed in the field of systems ecology allows us to build a high quality architecture of decision support systems that takes into account the specifics of the agronomic system. The design of a decision support system (DSS) should be a problem driven process. This requires a clear definition and role of all stakeholders which are directly or indirectly involved in the development and application of the DSS. When developing the elements of the DSS structure, the advantages of modern information and computer technology must be used. The structure of the decision models as central elements of the DSS must meet all criteria to ensure their quality and reliability. Decision models must therefore be constructed according to a clearly defined procedure for building ecological models. Any possibility that the DSS might propose wrong decisions that could be the result of a non-functional decision model, must be excluded. In this seminar, I will present the methodology of building decision support systems on three selected cases. The first example is the system for the assessment and management of the risk of surface and groundwater pollution with pesticides, which we developed for ARVALIS - Institut du végétal, France. Another example is the DSS for the simultaneous assessment of five soil functions, which we developed in the H2020 project LANDMARK. The third system, which is still under development, will assess the sustainability of the agronomic value chain based on legumes. We are developing it as part of the H2020 project TRUE.  In all systems, the method DEX is used to build qualitative multi-attribute decision models. We complement the existing agricultural expertise with knowledge obtained from data mining. All three decision support systems interact with the users via internet interfaces.
::<span style="text-justify:inter-ideograph">'''Séminaire [https://www6.inra.fr/imabs/ IMABS]'''</span> 
 
  
:
+
==== 13/11/2020&nbsp;: ''Conception et mise en œuvre d’un système modulaire de mini-bioréacteurs pour la culture continue de microorganismes''. Cyprien Guérin (Inrae, MaIAGE) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' “Every new body of discovery is mathematical in form, because there is no other guidance we can have” (Charles Darwin, 1809–1882). Biology is now awash with information, often with gigabytes of molecular data (DNA sequences; RNA expression levels; protein, metabolic, and methylation profiles) for each individual in a study. Hidden within this vast mass of data are hopefully strong signals that can be exploited for novel insight, and the search for such signals goes under a number of different names such as bioinformatics and systems biology. A number of molecular biologists are very proficient in generating such data, but only a handful of researchers have the requisite skills to develop and use the next generation of high dimensional statistics needed to find true associations. From a diametrically opposed side, Mathematicians have devoted enormous efforts to develop quantitative theory of the structure, organization, and dynamics of living systems. Questions such as at what speed should humans change from walking to running? Or how should an individual animal divide its resources, between growth and reproduction, to maximize its fitness? Are illuminated by the powerful methods of optimization theory. With a preference for quantitative genetics and genomics, in this seminar I will offer an opinionated overview of positives, and not so positives synergies between biology and mathematics.</span> 
 
  
*<span style="text-justify:inter-ideograph">'''Exceptionnellement mercredi''' 7/11/2018&nbsp;: ''Inference for high-dimensional Poisson regression problems.'' [https://www.ceremade.dauphine.fr/~rivoirar/ Vincent Rivoirard] (Université Paris-Dauphine, CEREMADE).</span>
+
:'''Résumé'''&nbsp;: Les systèmes de culture continue en bioréacteurs restent, malgré leur intérêt, peu utilisés dans les laboratoires de microbiologie. L’objectif de ce projet de thèse est de faciliter leur mise en œuvre en proposant un nouveau système modulaire de mini-bioréacteurs pilotés par ordinateur en s’appuyant sur les opportunités offertes par l’essor des technologies de fabrication numérique et des microcontrôleurs programmables. Les volumes de culture visés sont de l’ordre de 5 à 10 mL afin de permettre des plans d’expériences complexes pouvant impliquer de nombreux bioréacteurs (en parallèle, en cascade, avec suivi et contrôle en temps réel, ...). Comme preuves de concept, plusieurs applications chez la bactérie Gram-positive ''Bacillus subtilis'' sont envisagées aussi bien dans des contextes d’évolution expérimentale et dirigée que pour des études physiologiques s’appuyant sur de la comparaison de transcriptomes.
  
:
+
==== 06/11/2020&nbsp;: ''ComMod une posture !'' Etienne Delay (CIRAD, GREEN) [https://rawcdn.githack.com/ElCep/ComMod_pres/0e2e06875259e42c2e4929dc4b5182e6f3a9a1db/index.html#/ diaporama] ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Sparse linear regression problems appear in a variety of settings, but often the noise contaminating observations cannot accurately be described as bounded by or arising from a Gaussian distribution. Poisson observations in particular are a characteristic feature of several real-world applications. Previous work on sparse Poisson regression problems encountered several limiting technical hurdles. This talk describes a novel alternative analysis approach for sparse Poisson inverse problems that (a) sidesteps the technical challenges present in previous work, (b) admits estimators that can readily be computed using off-the-shelf LASSO algorithms, and (c) hints at a general weighted LASSO framework for broad classes of problems. At the heart of this new approach lies a weighted LASSO estimator for which data-dependent weights are based on Poisson concentration inequalities. Unlike previous analyses of the weighted LASSO, the proposed analysis depends on conditions which can be checked or shown to hold in general settings with high probability.</span> 
 
  
<span style="text-justify:inter-ideograph">'''Pas de séminaire le 2 novembre (vacances scolaires)'''</span>
+
:'''Résumé''' : Les modèles multi-agents et les jeux de rôles sont des outils de représentation et de simulation du fonctionnement des socio-écosystèmes qui aident à franchir les frontières disciplinaires pour étudier les processus de coordination entre acteurs et de décision collective. Depuis 20 ans l'UPR GREEN au CIRAD les utilisons dans le cadre d’une approche qualifiée de « modélisation d'accompagnement » (companion modeling approach). Cette présentation sera l'occasion de présenter la construction méthodologique de l'approche et ses évolutions à travers mes yeux de « dernier recruté » dans l'unité GREEN. Une occasion de raccrocher ce travail avec des problématiques de gestion des ressources naturelles, de bien commune, et de liens sociaux.
  
*<span style="text-justify:inter-ideograph">26/10/2018&nbsp;: ''De la recherche à l'innovation à l'INRA. Exemple du domaine d'Innovation "Agriculture Numérique".'' [https://informatique-mia.inra.fr/biosp/homepage-denis-allard Denis Allard] (BioSP -- CPI Agriculture Numérique, Dept. MIA, INRA)</span>
+
==== 23-30/10/2020&nbsp;: Pas de séminaire (vacances scolaires) ====
  
:
+
==== 16/10/2020&nbsp;: ''Estimation of species environmental niches and sampling effort from presence only records and illustration on the Pl@ntNet citizen-science flora data''. [http://christophebotella.fr/ Christophe Botella] (LECA) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Le domaine d'innovation (DI) "Agriculture de Précision", comme les 15 autres domaines de l'innovation définis à l'INRA sont l'un des éléments de la politique partenariat-transfert-innovation (PTI) mise en place à l'INRA depuis 2015 environ. Après avoir rappeler quelques éléments généraux concernant la PTI de l'INRA, et les missions couvertes par un DI, je détaillerai quelques enjeux de recherche relevant du DI "Agriculture Numérique".</span> 
 
  
*<span style="text-justify:inter-ideograph">19/10/2018&nbsp;: '''Séminaire remplacé par la soutenance de thèse de A. Imbert''': ''Intégration de données hétérogènes complexes à partir de tableaux de tailles déséquilibrées'' qui débutera à 14h en salle Marc Ridet</span>
+
:'''Résumé''': Naturalist mobile applications have been deployed worldwide in the last years and enabled access to a considerable amount of geolocated species presences records. This novel type of data represents a step forward to address ecological and conservation questions through the use of species distribution models (SDMs). However, in the absence of a sampling protocol, the sampling effort often concentrates on specific locations (cities, riverside walks, etc.) located in specific environments, resulting in estimation biases in SDMs. During my PhD, I studied methods to minimize bias in the estimation of inhomogeneous Poisson point processes (IPP) modelling species habitats preferences. I will present two approaches: (i) pooling occurrences from many species, using them as background points in the IPP and conditions under which it yields unbiased estimates, and (ii) the joint modeling of multiple species densities along with a common sampling effort component. Finally, I will show an illustration on Pl@ntNet's citizen science data over the whole French territory, integrating several hundred plant species and hundreds of thousands of observations over France with a highly biased sampling.
  
:
+
==== 09/10/2020&nbsp;: ''Model Exploration in Practice''. [https://iscpif.fr/projects/romain-reuillon/ Romain Reuillon] (CNRS, ISC-PIF) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Les avancées des nouvelles technologies de séquençage ont permis aux études cliniques de produire des données volumineuses et complexes. Cette complexité se décline selon diverses modalités, notamment la grande dimension, l'hétérogénéité des données au niveau biologique (acquises à différents niveaux de l'échelle du vivant et à divers moments de l'expérience), l'hétérogénéité du type de données, le bruit (hétérogénéité biologique ou données entachées d'erreurs) dans les données et la présence de données manquantes (au niveau d'une valeur ou d'un individu entier). L'intégration de différentes données est donc un défi important pour la biologie computationnelle. Cette thèse s'inscrit dans un projet de recherche clinique sur l'obésité, DiOGenes, pour lequel nous avons fait des propositions méthodologiques pour l'analyse et l'intégration de données. Ce projet est basé sur une intervention nutritionnelle menée dans huit pays européens et vise à analyser les effets de différents régimes sur le maintien pondéral et sur certains marqueurs de risque cardio-vasculaire et de diabète, chez des individus obèses. Dans le cadre de ce projet, mes travaux ont porté sur l'analyse de données transcriptomiques (RNA-Seq) avec des individus manquants et sur l'intégration de données transcriptomiques (nouvelle technique QuantSeq) avec des données cliniques. La première partie de cette thèse est consacrée aux données manquantes et à l'inférence de réseaux à partir de données d'expression RNA-Seq. Lors d'études longitudinales transcriptomiques, il arrive que certains individus ne soient pas observés à certains pas de temps, pour des raisons expérimentales. Nous proposons une méthode d'imputation multiple hot-deck (hd-MI) qui permet d'intégrer de l'information externe mesurée sur les mêmes individus et d'autres individus. hd-MI permet d'améliorer la qualité de l'inférence de réseau. La seconde partie porte sur une étude intégrative de données cliniques et transcriptomiques (mesurées par QuantSeq) basée sur une approche réseau. Nous y montrons l'intérêt de cette nouvelle technique pour l'acquisition de données transcriptomiques et l'analysons par une approche d'inférence de réseau en lien avec des données cliniques d'intérêt.</span> 
 
  
*<span style="text-justify:inter-ideograph">12/10/2018&nbsp;: ''Inférence de données de réseaux multipartites par modèles à blocs latents et stochastiques. Application en écologie et ethnobiologie.'' [https://www6.inra.fr/mia-paris/Equipes/Membres/Sophie-Donnet Sophie Donnet] (MIA Paris, INRA)</span>
+
:'''Résumé'''&nbsp;: The use of simulation models has widely spread in recent years, in various fields of academic research. Models are being developed to represent and try to better understand all kinds of systems: population dynamics, epidemics, transportation systems, macro-scale systems, micro-scale systems, etc. In some scientific areas, models and in silico simulations have become essential to help study in vivo situations.
 +
: However, simulation models are necessarily a simplification of reality, and hypotheses have to be made when developing a model. Thus every model can (and needs to?) be questioned: Is it relevant to tackle the research question behind it? How to extract significant knowledge from the model? What kind of dynamics can it exhibit? How does each mechanism of the model impact those dynamics? Is every mechanism really necessary? These are just some of the many questions a model developer has to answer in order to really know and understand his/her model!
 +
:This talk focuses on the worldwide zombie epidemic of the past few years. It raises the question of what can modelers say about it, and, it attempts to use model exploration, OpenMOLE (openmole.org) and the associated exploration methodology to build knowledge on this forefront phenomenon.
  
:
+
==== 02/10/2020&nbsp;: ''Méthodes mathématiques en écologie''. [https://www.ummisco.fr/?page_id=1150 Tri Nguyen-Huu] (IRD)  ([https://miat.inrae.fr/site/images/7/7e/Pr%C3%A9sentation_MIAT_%28light%29.pdf diaporama]) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Modéliser les relations entre entités (individus, insectes, plantes...) est une problématique classique en sciences sociales et en écologie et regrouper les entités étudiées en fonction des motifs observés dans le réseau permet de comprendre la topologie du réseau. Les modèle à blocs stochastiques ou latents sont une approche répandue pour regrouper les individus partageant le même comportement d'interaction. Dans ce travail, nous nous intéressons au cas où nous cherchons à modéliser des réseaux multipartites, i.e. des réseaux dans lesquels les entités appartiennent à des groupes fonctionnels prédéfinis. Les modèles à blocs stochastiques ou latents reposent sur l'introduction des variables latentes, rendant leur vraisemblance incalculable de façon explicite dès que la taille des réseaux augmente. Nous utilisons alors une version stochastique de l'algorithme EM. La pertinence de notre modèle et de notre méthode d'inférence est illustrée sur données simulées et réelles.</span> 
 
  
*<span style="text-justify:inter-ideograph">05/10/2018&nbsp;: ''Input output kernel regression for protein-protein interaction&nbsp;prediction and metabolite identification''. Céline Brouard (INRA, MIAT) [https://mia.toulouse.inra.fr/images/6/66/Seminaire.pdf diaporama]</span>
+
:'''Résumé'''&nbsp;:   Le développement de modèles mathématiques ont permis d'apporter un point de vue neuf sur des questions écologiques d'ordre général ou bien appliquées. Des modèles abstraits permettent de mieux comprendre les processus régissant certains écosystèmes, tandis que des modèles plus descriptifs permettent d'avoir une vision plus quantitative des phénomènes étudiés. Nous présenterons quelques modèles mathématiques issus des systèmes dynamiques (équations différentielles, équations aux différences finies) et nous intéresserons à ce qu'ils peuvent apporter à l'étude de quelques problèmes écologiques, à savoir la dynamique bio-économique des pêcheries, la connectivité d'espèces marines récifales, et la conservation des grands herbivores dans les parcs nationaux du Kenya.
  
:
+
==== 25/09/2020&nbsp;: ''Learning with pangenomes''. [https://lbbe.univ-lyon1.fr/-Jacob-Laurent-.html?lang=fr Laurent Jacob] (CNRS, LBBE) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Many real world learning tasks require predicting outputs that&nbsp;correspond to complex structured objects or to multiple interdependent&nbsp;outputs. Structured prediction approaches making use of the statistical&nbsp; dependencies between the output parts, have been shown to achieve an&nbsp;improved prediction performance in several applications. I will present&nbsp; a kernel-based structured output prediction approach, called Input&nbsp;Output Kernel Regression. In this approach the internal structure of the&nbsp;output data is encoded using a kernel function, that measures the&nbsp;similarity between two outputs. This approach is based on the idea of&nbsp; using the kernel trick in the output space and making predictions in a&nbsp;feature space associated with the output kernel. I will focus in my presentation on two applications of this work. The&nbsp;first application is the prediction of protein-protein interactions.&nbsp;Another application will be presented on the metabolite identification&nbsp;problem, that consists in determining the molecular structure of an&nbsp; unknown metabolite from tandem mass spectrometry data.</span> 
 
  
*<span style="text-justify:inter-ideograph">28/09/2018&nbsp;: ''La plateforme Souk.'' [http://homepages.laas.fr/gtredan/ Gilles Tredan] (LAAS, Toulouse)</span>
+
:'''Résumé'''&nbsp;: As the number and variety of sequenced genomes grows, representing them by comparison to a single reference leads to an increasing level of approximation, discarding accessory genes, rearrangements and repeated regions. This problem is particularly acute when studying microbial genomes or metagenomes, and hinders essential statistical tasks such as GWAS or prediction in this context. I will discuss genome representations which are well suited to statistical analysis when genomes are ill-suited to alignment or even assembly.
  
:
+
==== 18/09/2020&nbsp;: ''Partager de l'information pour faire face à un virus. Etude de cas en ostréiculture via un modèle multi-agent.'' Nicolas Paget (CIRAD) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Depuis 2012, une partie de nos recherches porte sur la caractérisation des structures d’interaction sociales. Nous avons pour cela développé une plateforme d’observation sociale des «&nbsp;cinétiques&nbsp;» humaines&nbsp;: SOUK (Social Observation of hUman Kinetics). Le principe de cette plateforme est de pouvoir collecter avec une grande précision spatiale et temporelle la position des individus d’une foule dense. SOUK fonctionne à la manière d’un GPS inversé plutôt précis (15cm) et rapide (1-4 hz). Grâce à ce système, il est possible de suivre le déplacement de groupes d'individus (jusqu'à 60 personnes) dans des espaces délimités, et d’analyser les mobilités et interactions au sein de ces groupes. Cet outil a été déployé lors de plusieurs campagnes expérimentales à Toulouse et à Milan dans des contextes variés&nbsp;: personnes dans une foule, danseurs, évènements sociaux (buffets), animaux au sein d’un troupeau... Lors de cette présentation a vocation panoramique, j'aborderai quelques résultats et perspectives issus de l’analyse des données ainsi collectées.</span> 
 
  
*<span style="text-justify:inter-ideograph">21/09/2018&nbsp;: ''Données de la recherche… Vers l’ouverture'' Nathalie Gandon (CODIR - Département MIA, INRA) [https://mia.toulouse.inra.fr/images/8/87/SeminaireNathalieGandon.pdf diaporama]</span>
+
:'''Résumé'''&nbsp;: Le postulat selon lequel le partage d'information permet de meilleures prises de décisions est fortement ancré. En développant un modèle multi-agent sur la plateforme Cormas, nous avons questionné ce postulat. Depuis quelques années, les ostréiculteurs font face à un virus (os-hv1) au fort taux de létalité. Ce virus n'est que mal connu. Dans le modèle, les agents, de rationalités variées, partagent leurs expériences et en tirent des leçons pour leurs pratiques. Nous étudions alors le type de décision prise par les agents en fonction de scénarios de partage de l'informations et d'hétérogénéité des agents. Les résultats montrent que l'hétérogénéité des agents permet une meilleure exploration de l'espace des possibles et qu'un partage et une interprétation trop radicaux des expériences de chacun à un effet contreproductif. Ce travail a été effectué en thèse. Lors de cette présentation, j'évoquerai aussi des travaux ou pistes de travaux plus récents ou en cours d'initialisation dans l'idée de susciter des collaborations.
  
:
+
==== 11/09/2020&nbsp;: ''Thigmoimmunité végétale. Comment la mécanoperception participe à la réponse immunitaire''. Adelin Barbacci (LIPM) ====
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Présentation des contextes (international, national et institutionnel), du cadre juridique et des offres de service inra autour de l’open data.</span> 
 
  
*<span style="text-justify:inter-ideograph">14/09/2018&nbsp;: ''Inférence des causes de la reprogrammation cellulaire par abduction'' [https://ibisc.univ-evry.fr/~delapla/ Franck Delaplace] (IBISC, Université d'Evry) [https://mia.toulouse.inra.fr/images/c/ce/Abduction-slide-print-FD.pdf diaporama]</span>
+
:'''Résumé'''&nbsp;: Les attaques de parasites sont responsables chaque année de pertes de récolte considérables à travers le monde. La recherche de sources génétiques de résistance durable chez les plantes constitue un levier important pour répondre à la demande alimentaire mondiale. ''Sclerotinia sclerotiorum'' est le champignon pathogène responsable de la maladie de la pourriture blanche sur plus de 400 espèces végétales, causant plusieurs millions d’euros de pertes de récolte chaque année, notamment sur colza. Comme la majorité des agents pathogènes, ''S. sclerotiorum'' utilise la sécrétion de molécules effectrices pour manipuler la physiologie des plantes hôtes et favoriser son développement. La mise en place de la QDR est consécutive à la perception du champignon. Toutefois, contrairement à la résistance gène-pour-gène plus largement étudiée, la QDR mobilise de nombreux réseaux de gènes qui sont encore méconnus et ne sont pas tous spécifiquement dédiés à l’immunité. Or, l'interaction plante-champignon met en jeu des signaux mécaniques importants, intrinsèques à la pénétration des tissus de l’hôte.
 +
:Au cours de ces deux dernières années nous avons réussi à montrer que les signaux mécaniques jouent un rôle de premier plan dans la mise en place de la réponse immunitaire et qu’il était possible de moduler fortement le niveau de résistance des plantes grâce à des ondes mécaniques. Ce travail est le fruit d’une collaboration étroite entre des équipes de physique (Aroune Duclos Laboratoire d’Acoustique de l’Université du Mans), de physiologie végétale (Nathalie Leblanc-Fournier INRA PIAF Clermont, Tou-Cheu Xiong INRA BPMP Montpellier) de biologie moléculaire (Adelin Barbacci LIPM) et de modélisation mathématique et informatique (Frédérick Garcia MIAT). C’est également le point de départ de la thèse de Khaoula Hadj-Amor coencadrée par MIAT et le LIPM. L’exposé s’attachera à présenter nos aventures entre mécanoperception, proprioception et réponse immunitaire.
  
:
+
== Séminaires reportés à une date ultérieure ==
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La médecine de réseau a pour objectif de définir la maladie à l’échelle des réseaux biologiques afin de mieux comprendre les mécanismes causaux de celle-ci. Des études dans ce domaine ont montré que la reprogrammation comportementale observée dans des maladies complexes telles que le cancer est causée par une modification du câblage du réseau moléculaire. La transition entre cellule saine et malade et inversement peuvent s'interpréter à l'échelle moléculaire comme une reprogrammation cellulaire induite par des perturbations topologiques des réseaux moléculaires induisant des changements du destin cellulaire. Pour la modélisation, l’objectif est d’inférer les actions topologiques sur un réseau induisant une variation de la dynamique incarnant ces transitions. Nous proposons un cadre théorique étendant les réseaux Booléens, appelé ''réseau booléen contrôlé'' où les actions de réseau topologique sont définies comme des contrôles de la dynamique. Sur la base de ce cadre, nous présentons un nouvel algorithme utilisant des principes de raisonnement abductif qui infère les perturbations causales minimales conduisant à un comportement attendu aux états stables de la dynamique. Ce cadre de modélisation s’applique à priori à un grand nombre de situation biologique d’alteration du destin cellulaire reposant sur sa reprogrammation. Nous l’illustrerons sur un modèle du cancer du sein, que nous considérons comme une preuve de concept, en inférant à la fois les oncogènes, les suppresseurs de tumeurs et des cibles thérapeutiques. ''Travail joint avec Célia Biane''</span> 
 
  
*<span style="text-justify:inter-ideograph">7/09/2018&nbsp;: ''SAA-ILP approach for multi-objective landscape optimization under uncertainty: theory and application'' [https://yanndujardinsite.wordpress.com/ Yann Dujardin] (MIAT)</span>
+
====  ''KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows''. [https://imag.umontpellier.fr/~charlier/ Benjamin Charlier] (Université de Montpellier, ARAMIS)====
  
:
+
:'''Résumé&nbsp;:''' The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula. It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' ''Theory:'' The Graph-based Markov Decision Process (GMDP) framework forms a class of MDP with factored state and action spaces, which has been studied for the past ten years. Since state and action spaces share the same graphical structure, it may be useful to model the control of spatial processes or collaborative multi-agent decision problems with local interactions. The concept of local policies in GMDP is especially useful, since it leads to interpretable objects, unlike optimal global policies which usually require exponential space to represent. Several time efficient algorithms to compute approximate local policies in GMDP have been proposed in the last decade. On the other hand, while efficient in practice, existing algorithms come without any performance guarantee on the returned local policies. Furthermore, while real-world collaborative decision problems modeled by GMDP generally contain several objectives to be optimized, no attention has been given yet, to our knowledge, to multi-objective GMDP. Our first contribution is to propose a Sample Average Approximation (SAA) approach for GMDP combined with an original ILP formulation. Unlike existing algorithms for GMDP, we provide theoretical hardness results and performance guarantees. Then, we show how the SAA-ILP approach can model and solve multi-objective GMDP. ''Application:'' An agricultural landscape can be devised according to various criteria,often antagonist (all of them cannot be optimized simultaneously). When managing agro-ecosystems, finding "good compromise" solutions between these criteria is therefore&nbsp;critical. However, finding landscape management strategies that enable to reach satisfying trade-offs on different criteria is difficult for several reasons: 1) the processes involved in these strategies making are spatio-temporal processes, 2) decision must been made under uncertainty, 3) modeling and solving multi-objective optimization problems is more difficult that mono-objective ones. We consider the problem of finding best compromise solutions to a particular multi-objective landscape management problem under uncertainty. Possible decisions consist in assigning a sequence of cultures, over a time horizon, to every site of an agricultural network. These sequences will directly influence three criteria: total profit, biodiversity, and equity between the stakeholders. Sequences also influence pollinators dynamics, the position of which can itself influence the criteria in another way. Criteria are computed over a time horizon. The dynamics of the pollinators are spatio-temporal and subject to uncertainty. To solve this problem, we propose a multi-objective SAA-ILP-based solver that allows a decision-maker to interactively discover the agricultural landscape that corresponds to a (subjective) best compromise between the criteria.</span>
+
:KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU. KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
 +
:Web site: http://www.kernel-operations.io
  
== Séminaires passés / Past seminars &nbsp;: ==
+
== Séminaires passés / Past seminars ==
  
 
Lien vers la [[List_of_past_seminars|Liste des séminaires passés]] de l'unité MIAT.
 
Lien vers la [[List_of_past_seminars|Liste des séminaires passés]] de l'unité MIAT.
  
== Contacts: ==
+
== Contacts ==
  
Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter [mailto:patrick(dot)taillandier(at)toulouse(dot)inra(dot)fr Patrick Taillandier] ou [mailto:matthias(dot)zytnicki(at)toulouse(dot)inra(dot)fr Matthias Zytnicki].
+
Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter [mailto:patrick(dot)taillandier(at)inra(dot)fr Patrick Taillandier] ou [mailto:matthias(dot)zytnicki(at)inra(dot)fr Matthias Zytnicki].

Version actuelle datée du 25 février 2021 à 09:00

Sommaire

Séminaires de l'unité MIAT

Pyrenees-morning.jpg

Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.

Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué ici (nous sommes à moins de 30 mètres de la réception !).


Séminaires de l'année en cours et séminaires futurs

25/06/2021 :

18/06/2021 :

11/06/2021 :

04/06/2021 : Séminaire interne : Record

28/05/2021 : Titre à venir. Magali Berland (MetaGenoPolis, INRAE)

21/05/2021 : Classer la migration à l'ère du Big Data. Est-il possible d'identifier le comportement de migration par des routines automatiques ? Performance de 3 méthodes, MigrO, MigrateR et une approche de segmentation Lucie Debeffe (INRAE, CEFS)

14/05/2021 :

07/05/2021 : Séminaire interne : SciDyn

23/04/2021 et 30/04/2021  : Pas de séminaire (vacances scolaires)

16/04/2021 : Optimal convergence rates for Nesterov acceleration. Aude Rondepierre (INSA/IMT)

Résumé : In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.

09/04/2021 : Titre à venir. Estelle Kuhn (MaIAGE, INRAE)

02/04/2021 : Séminaire interne : SAAB

26/03/2021 : "Titre à venir" Christophe Denis (LAMA, Université Paris-Est Marne-la-Vallée)

19/03/2021 : "Titre à venir" Vincent Rocher (CBI, Université Paul Sabatier)

12/03/2021 : Séminaire interne : Clément Birbes (plateforme bio-info)

05/03/2021 exceptionnellement à 11h : Pourquoi et comment réduire les émissions de gaz à effet de serre du secteur de la recherche en France ? L’approche bottom up proposée par Labos 1point5. Odile Blanchard (GAEL, Université de Grenoble)

Résumé : La France s’est engagée à la neutralité carbone à l’horizon 2050. Cela signifie que les émissions de gaz à effet de serre de la France doivent diminuer fortement, de façon très rapide, pour atteindre zéro émissions nettes en 2050.
Le séminaire vise d’une part à discuter pourquoi le secteur de la recherche doit contribuer à la réduction des émissions de gaz à effet de serre de la France et d’autre part à exposer comment le collectif Labos 1point5 s’est emparé de la question depuis 2 ans au sein de la communauté scientifique française.
Le séminaire sera l’occasion de présenter le collectif Labos 1point5, ses objectifs, sa structuration, ses travaux. Un temps particulier sera consacré à l’outil d’estimation des émissions de gaz à effet de serre des laboratoires, GES 1point5. Développé par le collectif dans une démarche bottom up, GES 1point5 permet à la fois de définir des plans d’actions pour réduire les émissions de gaz à effet de serre des laboratoires, de mener des expérimentations dans ce domaine dans les laboratoires, et d’engager des travaux de recherche sur l’empreinte carbone de la recherche.

05/03/2021 à 10h : Soutenance de thèse de Jelena Vucinic : Modélisation moléculaire et Intelligence Artificielle pour le design computationnel de protéines: conception d'enzymes optimisées et de nano-anticorps

01/03/2021 à 15h : Soutenance de thèse Manon Ruffini : Modèles et méthodes pour les problèmes de design de protéines multi-états

19/02/2021 et 26/02/2021 : Pas de séminaire (vacances scolaires)

12/02/2021 : A metagenomic-data-based model of the gut microbiota Simon Labarthe (INRAE/MaIAGE)

Résumé : The human gut harbors a complex bacterial community, the gut microbiota, that maintains a symbiotic relationship with its host: the microbiota ecology is then linked to the host’s health. Mathematical models of the microbial population dynamics are therefore a promising tool to study the mechanisms driving the homeostasis or the dysbiosis of the microbiota, and the links with pathologies.
We couple a PDE population dynamics model of functional microbial meta-populations involved in fibre degradation to a fluid mechanic model of the intestinal content. The metabolic capabilities of the meta-populations are inferred from functional metagenomic data through NMF (non-negative matrix factorization). Metabolic models of the meta-populations are built to predict the metabolite consumptions and the growth rates, and are plugged to the PDE population dynamics model to account for the interactions between the bacterial populations and the intestinal environment. Furthermore, the taxonomic composition of the meta-populations is derived from an additional non-negative least square problem regressing taxonomic marker gene counts against the weight matrix resulting from the previous NMF. This approach makes possible direct comparisons between the model outputs and both gene (shotgun) or bacterial (16s) counts.
This work is a collaboration with B. Laroche, and with M. Ribot, B. Polizzi, T. Phan and T. Goudon for the population/fluid dynamics model of the microbiota and its environment, and with L. Darrigade and M.Leclerc for the metapopulation construction.

05/02/2021 : Journée reproductibilité dans le cadre des animations IMABS programme à ce lien

29/01/2021 : Developing an ontological framework for facilitating the exploitation and re-use of phenomics data based on a formalisation of numerical relationships Luis-Felipe Vargas-Rojas (LEPSE, INRAE)

Résumé : In recent years, plant phenomics has produced massive datasets involving experiments performed in the field and controlled conditions, concerning hundreds of genotypes at different scales of organisation. Taken together, these datasets are unprecedented resources for identifying and testing novel mechanisms and models (Tardieu et al., 2017). Assembling and organising such datasets is not straightforward because of the heterogeneous, multi-scale and multi-source nature of data, to deal partially with these issues, the phenomics community has proposed an ontology-driven Information System (PHIS, www.phis.inra.fr, Neveu et al., 2019) based on FAIR principles (Wilkinson et al., 2016). However, exploitation and re-use of these datasets have not reached its full potential because (1) metadata is often merely informative, (2) relationships between numerical attributes are poorly formalised, whereas (3) ontological reasoning is more efficient for representing categorical data. For instance, relationships such as unit conversion are not effectively used, even if the data is well-annotated and information to perform the computation is provided by unit ontologies (OM, QUDT). The goal of the thesis is to create an ontological framework for representing and computing different kinds of numerical relationships for plant phenomics attributes. It will focus on equations representing most current variables and data-manipulation processes in plant phenomics (e.g. unit conversions, thermal time, and phyllochron). For each use-case, details about metadata, context-dependencies, links between domain-specific ontologies and the formalisation of the equation structure, will be presented. Finally, the concrete machinery to perform these context-aware computations and an effective information retrieval, meant to reduce the user's time-effort and the query definition complexity, will be proposed.

22/01/2021 : Predicting the intensity function of point processes beyond observation areas. Edith Gabriel (INRAE/BioSP)

Résumé : Seismic networks provide data that are used a basis both for public safety decisions and for scientific research. Their configuration affects the data completeness, which in turn, critically affects several seismological scientific targets (e.g., earthquake prediction, seismic hazard...). How to map earthquakes density in seismogenic areas that are not covered by the network? We propose to predict the spatial distribution of earthquakes from the knowledge of presence locations and geological relationships, taking into account any interactions between records. Namely, in a more general setting, we aim to estimate the intensity function of a point process in windows where it has not been observed, conditional to its realization in observed windows, as in geostatistics for continuous processes. We define a predictor as the best linear unbiased combination of the observed point pattern. We show that the weight function associated to the predictor is the solution of a Fredholm equation of second kind. Both the kernel and the source term of the Fredholm equation are related to the second order characteristics of the point process through the pair correlation function. Results are presented and illustrated on simulated nonstationary processes, using continuous covariates or the realization of additional point processes, and real data for mapping Greek Hellenic seismicity in a region with unreliable and incomplete records.

15/01/2021 : Evolution artificielle interactive : comment aborder le participatif ? Évelyne Lutton (MIA/ISC-PIF)

Résumé : La question de l’interaction avec l’humain (sa connaissance, son intuition) est centrale pour les approches d’évolution artificielle interactive (iEC). Sur la base d’exemples personnels, cet exposé tente d’identifier quelques thèmes de recherche émergents, en considérant différents contextes, du mono-utilisateur au multi-utilisateurs. Les questions liées aux développements d’applications participatives semblent particulièrement difficiles et intéressantes.

08/01/2021 : DEX method: recent advances and future challenges on developing predictive models from data Marko Bohanec et Sašo Džeroski (Jožef Stefan Institute, Ljubljana)

Résumé : In the last decade, decision support and data mining approaches have become indispensable tools for researchers and practitioners in agronomy and related fields. Decision modelling is aimed at developing models, usually through collaboration of decision makers and experts, for suggesting and justifying solutions of the problem at hand. Data mining uses data to find meaningful patterns, most often in the form of predictive models, for a similar purpose. Both types of models can be included in decision support systems for aiding decision makers in recurring decision tasks. This seminar will be given through two 30-minute presentations by two senior researchers from Jožef Stefan Institute, Department of Knowledge Technology, Ljubljana, Slovenia: Marko Bohanec, an expert in decision support and creator of DEX method and DEXi software and Sašo Džeroski, an expert in data mining, leading the development of many data mining tools, and Head of the Department. Marko Bohanec will focus on the method DEX and present some recent advances and plans, for instance inclusion of the option generator method in DEXi. Participants who already know DEXi are kindly asked to pose questions and give comments. Sašo Džeroski will present some methods for mining complex data, in particular methods for multi-target prediction. He will also illustrate their use on several problems from ecology and agriculture.

25/12/2020 et 01/12/0202 : Pas de séminaire (vacances scolaires)

18/12/2020 : De l’aide à la décision à l’aide à la réflexion, un glissement paradigmatique… Franck Taillandier (INRAE/RECOVER)

Résumé : Décider est une préoccupation partagée par tous les domaines d’application ; l’étudier, accompagner les gens vers de bons choix est une préoccupation majeure, hier comme aujourd’hui. La recherche scientifique a ainsi investi le champ de l’aide à la décision sous de multiples angles, du plus théorique au plus appliqué. Cela offre un corpus d’une richesse rare et un panel d’outils propres à répondre à de nombreuses problématiques. Mais cela ne va pas sans soulever de questions… Est-on toujours sûr d’utiliser ces outils à bon escient ? Qu’est-ce qu’une bonne décision ou qu’une bonne démarche d’aide à la décision ? D’ailleurs, qu’entend-on par « aide » à la décision ? Ce séminaire n’aura pas vocation à vous apporter toutes les réponses, mais fidèle à la démarche que je prône, à vous faire réfléchir quant à ces questions…

11/12/2020 : Analyse de données spectroscopiques par clustering de variables et réduction de dimension interprétables Rebecca Marion (UCLouvain - Belgique) diaporama

Résumé : En métabolomique, la spectroscopie par résonance magnétique nucléaire (RMN) est un moyen courant de quantifier les concentrations de métabolites. Les spectres RMN sont très reproductibles, ce qui implique que la plupart des variations entre les spectres représentent des différences biologiques entre les échantillons. De plus, comme la spectroscopie RMN peut quantifier des molécules connues et inconnues, elle est particulièrement utile pour identifier et caractériser de nouveaux composés, ce qui en fait une plate-forme importante pour la découverte de biomarqueurs. L'identification des biomarqueurs dans un spectre RMN se résume à l'identification des groupes de variables ou des régions spectrales qui prédisent le mieux le résultat biologique qui nous intéresse. Dans ce séminaire, nous présentons notre nouvelle méthode, Adaptive Clustering around Latent Variables (AdaCLV), qui permet d’identifier de tels clusters de variables de façon non-supervisée. AdaCLV s'inspire des méthodes multivariées existantes de la famille Clustering around Latent Variables (CLV), tout en offrant plusieurs avantages clés par rapport à ces méthodes, tels que sa meilleure précision et son interprétabilité, ainsi que de sa robustesse aux changements de valeurs d’hyperparamètres.

04/12/2020 : Journée des doctorants du pôle IMABS : programme

27/11/2020 : Simulation en recherche médicale. Généralités, exemple et problème connexe. Nicolas Savy (IMT) diaporama

Résumé : Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.

20/11/2020 : Development of decision support systems for application in agronomy. Marko Debeljak (Jožef Stefan Institute, Ljubljana) diaporama

Résumé : Agronomy is increasingly embedded in the broader social and economic context. Its obligations and commitments to meet the objectives of sustainable development goals and ecosystem services are increasing. Due to the rapid development of other fields of research, agronomy is intensively introducing digitisation, which is leading to the accumulation of ever-increasing amounts of data. In parallel with digitisation, extensive informatisation is taking place in agronomy too. It increases the exchange and collection of large amount of knowledge and experiences. Agronomy is in a position where it must make quick and correct decisions about the growing number of problems and expectations of society. Therefore, decision-making in agronomy has become an extremely complex process that can only be managed with an objective scientific approach. Experiences from systems ecology and ecological modelling for the development of decision support systems have proven to be very helpful. The application of methods developed in the field of systems ecology allows us to build a high quality architecture of decision support systems that takes into account the specifics of the agronomic system. The design of a decision support system (DSS) should be a problem driven process. This requires a clear definition and role of all stakeholders which are directly or indirectly involved in the development and application of the DSS. When developing the elements of the DSS structure, the advantages of modern information and computer technology must be used. The structure of the decision models as central elements of the DSS must meet all criteria to ensure their quality and reliability. Decision models must therefore be constructed according to a clearly defined procedure for building ecological models. Any possibility that the DSS might propose wrong decisions that could be the result of a non-functional decision model, must be excluded. In this seminar, I will present the methodology of building decision support systems on three selected cases. The first example is the system for the assessment and management of the risk of surface and groundwater pollution with pesticides, which we developed for ARVALIS - Institut du végétal, France. Another example is the DSS for the simultaneous assessment of five soil functions, which we developed in the H2020 project LANDMARK. The third system, which is still under development, will assess the sustainability of the agronomic value chain based on legumes. We are developing it as part of the H2020 project TRUE. In all systems, the method DEX is used to build qualitative multi-attribute decision models. We complement the existing agricultural expertise with knowledge obtained from data mining. All three decision support systems interact with the users via internet interfaces.

13/11/2020 : Conception et mise en œuvre d’un système modulaire de mini-bioréacteurs pour la culture continue de microorganismes. Cyprien Guérin (Inrae, MaIAGE)

Résumé : Les systèmes de culture continue en bioréacteurs restent, malgré leur intérêt, peu utilisés dans les laboratoires de microbiologie. L’objectif de ce projet de thèse est de faciliter leur mise en œuvre en proposant un nouveau système modulaire de mini-bioréacteurs pilotés par ordinateur en s’appuyant sur les opportunités offertes par l’essor des technologies de fabrication numérique et des microcontrôleurs programmables. Les volumes de culture visés sont de l’ordre de 5 à 10 mL afin de permettre des plans d’expériences complexes pouvant impliquer de nombreux bioréacteurs (en parallèle, en cascade, avec suivi et contrôle en temps réel, ...). Comme preuves de concept, plusieurs applications chez la bactérie Gram-positive Bacillus subtilis sont envisagées aussi bien dans des contextes d’évolution expérimentale et dirigée que pour des études physiologiques s’appuyant sur de la comparaison de transcriptomes.

06/11/2020 : ComMod une posture ! Etienne Delay (CIRAD, GREEN) diaporama

Résumé : Les modèles multi-agents et les jeux de rôles sont des outils de représentation et de simulation du fonctionnement des socio-écosystèmes qui aident à franchir les frontières disciplinaires pour étudier les processus de coordination entre acteurs et de décision collective. Depuis 20 ans l'UPR GREEN au CIRAD les utilisons dans le cadre d’une approche qualifiée de « modélisation d'accompagnement » (companion modeling approach). Cette présentation sera l'occasion de présenter la construction méthodologique de l'approche et ses évolutions à travers mes yeux de « dernier recruté » dans l'unité GREEN. Une occasion de raccrocher ce travail avec des problématiques de gestion des ressources naturelles, de bien commune, et de liens sociaux.

23-30/10/2020 : Pas de séminaire (vacances scolaires)

16/10/2020 : Estimation of species environmental niches and sampling effort from presence only records and illustration on the Pl@ntNet citizen-science flora data. Christophe Botella (LECA)

Résumé: Naturalist mobile applications have been deployed worldwide in the last years and enabled access to a considerable amount of geolocated species presences records. This novel type of data represents a step forward to address ecological and conservation questions through the use of species distribution models (SDMs). However, in the absence of a sampling protocol, the sampling effort often concentrates on specific locations (cities, riverside walks, etc.) located in specific environments, resulting in estimation biases in SDMs. During my PhD, I studied methods to minimize bias in the estimation of inhomogeneous Poisson point processes (IPP) modelling species habitats preferences. I will present two approaches: (i) pooling occurrences from many species, using them as background points in the IPP and conditions under which it yields unbiased estimates, and (ii) the joint modeling of multiple species densities along with a common sampling effort component. Finally, I will show an illustration on Pl@ntNet's citizen science data over the whole French territory, integrating several hundred plant species and hundreds of thousands of observations over France with a highly biased sampling.

09/10/2020 : Model Exploration in Practice. Romain Reuillon (CNRS, ISC-PIF)

Résumé : The use of simulation models has widely spread in recent years, in various fields of academic research. Models are being developed to represent and try to better understand all kinds of systems: population dynamics, epidemics, transportation systems, macro-scale systems, micro-scale systems, etc. In some scientific areas, models and in silico simulations have become essential to help study in vivo situations.
However, simulation models are necessarily a simplification of reality, and hypotheses have to be made when developing a model. Thus every model can (and needs to?) be questioned: Is it relevant to tackle the research question behind it? How to extract significant knowledge from the model? What kind of dynamics can it exhibit? How does each mechanism of the model impact those dynamics? Is every mechanism really necessary? These are just some of the many questions a model developer has to answer in order to really know and understand his/her model!
This talk focuses on the worldwide zombie epidemic of the past few years. It raises the question of what can modelers say about it, and, it attempts to use model exploration, OpenMOLE (openmole.org) and the associated exploration methodology to build knowledge on this forefront phenomenon.

02/10/2020 : Méthodes mathématiques en écologie. Tri Nguyen-Huu (IRD) (diaporama)

Résumé : Le développement de modèles mathématiques ont permis d'apporter un point de vue neuf sur des questions écologiques d'ordre général ou bien appliquées. Des modèles abstraits permettent de mieux comprendre les processus régissant certains écosystèmes, tandis que des modèles plus descriptifs permettent d'avoir une vision plus quantitative des phénomènes étudiés. Nous présenterons quelques modèles mathématiques issus des systèmes dynamiques (équations différentielles, équations aux différences finies) et nous intéresserons à ce qu'ils peuvent apporter à l'étude de quelques problèmes écologiques, à savoir la dynamique bio-économique des pêcheries, la connectivité d'espèces marines récifales, et la conservation des grands herbivores dans les parcs nationaux du Kenya.

25/09/2020 : Learning with pangenomes. Laurent Jacob (CNRS, LBBE)

Résumé : As the number and variety of sequenced genomes grows, representing them by comparison to a single reference leads to an increasing level of approximation, discarding accessory genes, rearrangements and repeated regions. This problem is particularly acute when studying microbial genomes or metagenomes, and hinders essential statistical tasks such as GWAS or prediction in this context. I will discuss genome representations which are well suited to statistical analysis when genomes are ill-suited to alignment or even assembly.

18/09/2020 : Partager de l'information pour faire face à un virus. Etude de cas en ostréiculture via un modèle multi-agent. Nicolas Paget (CIRAD)

Résumé : Le postulat selon lequel le partage d'information permet de meilleures prises de décisions est fortement ancré. En développant un modèle multi-agent sur la plateforme Cormas, nous avons questionné ce postulat. Depuis quelques années, les ostréiculteurs font face à un virus (os-hv1) au fort taux de létalité. Ce virus n'est que mal connu. Dans le modèle, les agents, de rationalités variées, partagent leurs expériences et en tirent des leçons pour leurs pratiques. Nous étudions alors le type de décision prise par les agents en fonction de scénarios de partage de l'informations et d'hétérogénéité des agents. Les résultats montrent que l'hétérogénéité des agents permet une meilleure exploration de l'espace des possibles et qu'un partage et une interprétation trop radicaux des expériences de chacun à un effet contreproductif. Ce travail a été effectué en thèse. Lors de cette présentation, j'évoquerai aussi des travaux ou pistes de travaux plus récents ou en cours d'initialisation dans l'idée de susciter des collaborations.

11/09/2020 : Thigmoimmunité végétale. Comment la mécanoperception participe à la réponse immunitaire. Adelin Barbacci (LIPM)

Résumé : Les attaques de parasites sont responsables chaque année de pertes de récolte considérables à travers le monde. La recherche de sources génétiques de résistance durable chez les plantes constitue un levier important pour répondre à la demande alimentaire mondiale. Sclerotinia sclerotiorum est le champignon pathogène responsable de la maladie de la pourriture blanche sur plus de 400 espèces végétales, causant plusieurs millions d’euros de pertes de récolte chaque année, notamment sur colza. Comme la majorité des agents pathogènes, S. sclerotiorum utilise la sécrétion de molécules effectrices pour manipuler la physiologie des plantes hôtes et favoriser son développement. La mise en place de la QDR est consécutive à la perception du champignon. Toutefois, contrairement à la résistance gène-pour-gène plus largement étudiée, la QDR mobilise de nombreux réseaux de gènes qui sont encore méconnus et ne sont pas tous spécifiquement dédiés à l’immunité. Or, l'interaction plante-champignon met en jeu des signaux mécaniques importants, intrinsèques à la pénétration des tissus de l’hôte.
Au cours de ces deux dernières années nous avons réussi à montrer que les signaux mécaniques jouent un rôle de premier plan dans la mise en place de la réponse immunitaire et qu’il était possible de moduler fortement le niveau de résistance des plantes grâce à des ondes mécaniques. Ce travail est le fruit d’une collaboration étroite entre des équipes de physique (Aroune Duclos Laboratoire d’Acoustique de l’Université du Mans), de physiologie végétale (Nathalie Leblanc-Fournier INRA PIAF Clermont, Tou-Cheu Xiong INRA BPMP Montpellier) de biologie moléculaire (Adelin Barbacci LIPM) et de modélisation mathématique et informatique (Frédérick Garcia MIAT). C’est également le point de départ de la thèse de Khaoula Hadj-Amor coencadrée par MIAT et le LIPM. L’exposé s’attachera à présenter nos aventures entre mécanoperception, proprioception et réponse immunitaire.

Séminaires reportés à une date ultérieure

KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows. Benjamin Charlier (Université de Montpellier, ARAMIS)

Résumé : The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula. It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU. KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
Web site: http://www.kernel-operations.io

Séminaires passés / Past seminars

Lien vers la Liste des séminaires passés de l'unité MIAT.

Contacts

Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter Patrick Taillandier ou Matthias Zytnicki.

Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels