Séminaires : Différence entre versions

De MIAT INRA
Aller à : navigation, rechercher
(Séminaires de l'unité MIAT :)
(15/01/2021 : Titre à venir. Évelyone Lutton (MIA/ISC-PIF))
(233 révisions intermédiaires par 5 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
= Séminaires de l'unité MIAT : =
+
 
 +
= Séminaires de l'unité MIAT =
  
 
[[File:Pyrenees-morning.jpg|thumb|center|800px|Pyrenees-morning.jpg]]
 
[[File:Pyrenees-morning.jpg|thumb|center|800px|Pyrenees-morning.jpg]]
  
Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.  
+
Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.
 
 
Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi.
 
L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué [[Accès_MIAT|ici]] (nous sommes à moins de 30 mètres de la réception !).
 
 
 
<!--The seminar of the MIAT Unit of the INRA in Toulouse is a place for scientific and technical exchanges between members of the unit and experts in mathematics, computer science,&nbsp;agro-ecosystems, bioinformatics ''etc.'' Talks can be on mature ongoing working subjects, on finalized highly specialized projects or have a more informative/educational scope. The focus can be on methodological aspects as well as on applications. Some presentations during other local seminars can be flagged as highly interesting to the usual audience of the MIAT seminar.
 
Presentations can be either in English or in French. According to the presentation, a typical seminar lasts from 45min to a couple of hours. Unless otherwise stated, it is held in the MIAT meeting room at 10.30 on Fridays. Acces to the INRA Auzeville/Castanet, MIAT unit is indicated [[Accès_MIAT|here]] (we're less than 30 meters from the reception&nbsp;!). -->
 
 
 
== Séminaires de l'année en cours et séminaires futurs &nbsp;: ==
 
 
 
'''Pas de séminaire le 26 avril et le 3 mai (vacances scolaires)'''
 
 
 
*19/04/2019&nbsp;: ''Titre à venir''. [https://sites.google.com/view/madalina-olteanu/home Madalina Olteanu] (Panthéon Sorbonne / MaIAGE).
 
 
 
*12/04/2019&nbsp;: ''Titre à venir''. [https://www6.toulouse.inra.fr/toxalim_eng/Research-Teams/E2-MeX-Metabolism-of-Xenobiotics/Research/Metabolic-Networks Nathalie Poupin] (INRA Toulouse, Toxalim)
 
 
 
*29/03/2019&nbsp;: ''Titre à venir''. [https://www6.bordeaux-aquitaine.inra.fr/sante-agroecologie-vignoble/Personnel/Scientifiques/Frederic-Fabre Frédéric Fabre] (INRA Bordeaux, SAVE) '''Séminaire [https://www6.inra.fr/imabs/ IMABS]'''
 
 
 
*22/03/2019&nbsp;: ''Probing sequence-level instructions for gene expression''. [http://www.igmm.cnrs.fr/en/service/biogenese-micro-arns/ Charles Lecellier] (Institut de Génétique Moléculaire de Montpellier / Institut de Biologie Computationnelle, CNRS).
 
 
 
:
 
::'''Résumé&nbsp;:''' Gene expression is orchestrated by distinct regulatory regions to ensure a wide variety of cell types and functions. A challenge is to identify which regulatory regions are active, what are their associated features and how they work together in each cell type. This is all the more warranted as GWAS studies show that the vast majority of the human genome harbors plethora of regulatory elements lying in unannotated regions and their characterization is a necessary step towards the development of medical genomics. In that context, we develop machine learning methods to integrate and interpret diverse types of genomics data, delineate relevant genomic regions and identify novel regulatory elements. I will specifically present our work demonstrating the existence of instructions for gene expression lying at the level of DNA sequence. Our approach positions nucleotide composition as a critical component of gene expression and unveils a strong influence of intronic sequences. We further show that these instructions can be linked to co-regulations associated with genome 3D architecture and to associations of genes within topologically associated domains. 
 
 
 
*15/03/2019&nbsp;: ''Titre à venir''. Joon Kwon (MIA Paris).
 
 
 
'''Pas de séminaire le 1er et 8 mars (vacances scolaires)'''
 
 
 
*22/02/2019&nbsp;:&nbsp;''Utilisabilité des indices de végétation MODIS pour la prévision du rendement de la culture de maïs aux Etats Unis''. [https://mia.toulouse.inra.fr/Ronan_TREPOS Ronan Trepos] (MIAT, INRA).
 
 
 
*15/02/2019&nbsp;: ''Au-delà des conteneurs&nbsp;: Environnements logiciels reproductibles avec GNU Guix''. [http://people.bordeaux.inria.fr/lcourtes/ Ludovic Courtès] (INRIA Bordeaux, SED).
 
 
 
:
 
::'''Résumé&nbsp;:''' La reproductibilité des expériences impliquant du logiciel est un enjeu scientifique majeur. Docker et Singularity peuvent répliquer un environnement logiciel mais permettent difficilement d’aller au-delà et d’expérimenter. Peut on concilier reproductibilité et expérimentation pour les environnements logiciels&nbsp;? GNU&nbsp;Guix est comparable à apt-get, yum ou CONDA, mais il fournit des binaires reproductibles et un suivi de leur provenance. Il peut aider à la gestion d’environnements comme VirtualEnv ou encore provisionner des conteneurs. J’évoquerai notre expérience avec Guix en calcul intensif (HPC) et son positionnement par rapport à des outils comme Singularity ou EasyBuild. Enfin j'expliquerai comment nous cherchons à intégrer la notion de déploiement au cœur d’applications telles que Jupyter ou les outils de gestion de pipelines. Liens&nbsp;: [https://guix-hpc.bordeaux.inria.fr/ https://guix-hpc.bordeaux.inria.fr/] et [https://gnu.org/s/guix https://gnu.org/s/guix] 
 
 
 
*8/02/2019&nbsp;:&nbsp;''Approaches for predicting phenotypic plasticity of agronomical traits''. [https://www6.toulouse.inra.fr/agir/Les-equipes/VASCO/Membres/Pierre-Casadebaig Pierre Casadebaig] (UMR AGIR, INRA Toulouse).
 
 
 
:
 
::'''Résumé&nbsp;:''' Ce séminaire présente deux approches numériques pour prédire des traits complexes agronomiques dans une diversité d'environnements. Un premier cas d'étude considère que l'on dispose d'informations sur le génotype des variétés étudiées et propose des approches de modélisation adaptées (gene-based models, whole genome prediction models). Ce cas d'étude sera illustré par quelques exemples avec la culture de tournesol. Dans un second cas d'étude, nous disposons de moins d'informations sur la plante et présenterons une approche de modélisation basée sur les traits fonctionnels. Nous illustrerons cette approche avec un  récent projet de recherche sur les cultures associées (mélange de deux espèces dans un même champ).
 
 
 
*1/02/2019&nbsp;:&nbsp;''Sociétés rurales du passé et du présent&nbsp;: Une approche par Modélisation sociale multi-agents spatialisée''. Medhi Saqalli (UMR GEODE, CNRS).
 
 
 
:
 
::'''Résumé&nbsp;:''' Cette présentation traite de la démarche élaborée pour la reconstitution des socio-écosystèmes au sens de Elinor Ostrom, à savoir la combinaison populations et règles sociales d’une part, territoire et environnement d’autre part, qui interagissent par l’intermédiaire des aménités et services écosystémiques qui les relient et en particulier via les systèmes agraires.&nbsp;<span style="text-align: justify">Nous présentons plusieurs exemples d’application actuels (dynamiques sociales, modes d’organisation familiale et héritages au Sahel nigérien&nbsp;; contamination pétrolière et colonisation de l’Amazonie équatorienne) et passés (populations et systèmes agraires de la culture rubanée sur les 1000 ans entourant l’expansion et la disparition finale de cette culture sur l’Europe tempérée).&nbsp;</span><span style="text-align: justify">La construction de ces modélisations multi-agents spatialisées passe par la formalisation des paramètres environnementaux et agro-zootechniques mais aussi des règles socio-anthropologiques et économiques qui, fonctionnant et s’adaptant aux mailles les plus petites, sociales (la famille et l’individu), temporelle (la saison, le mois voire la semaine) et spatiale (l’hectare le plus souvent) et évoluant selon les conditions du milieu local (écologie, dynamique passée, démographie) permettent de reconstituer des dynamiques sociales et spatiales passées mais aussi, pour l’actuel, d’envisager une exploration de la résilience des systèmes et de la prospective sur leurs futurs, au travers de scénarios dont la légitimité est toujours à formaliser collectivement.</span> 
 
 
 
*<span style="text-justify:inter-ideograph">25/01/2019&nbsp;: ''Développements récents et ouvertures pour la détection de segments atypiques au sein de séquences''. [https://perso.math.univ-toulouse.fr/mercier/ Sabine Mercier] (UT2J, IMT).</span>
 
 
 
:
 
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Nous commencerons par définir le score local et présenter le contexte historique des travaux théoriques sur sa distribution. Deux résultats récents seront ensuite développés. Une approximation asymptotique de la loi du score local pour une chaîne de Markov, améliorant les résultats de Karlin et Dembo de 1992 ''passés sous silence'', sera tout d'abord présentée. Nous proposons ensuite de probabiliser l'espace de tous les segments possibles, optimaux et sous optimaux, sans se limiter aux segments réalisant le score local&nbsp;; de mettre cet espace en relation avec celui provenant naturellement de l'utilisation des chaînes de Markov cachées. Cette dualité permet alors un transfert de compétences pour la détection de segments atypiques. Les ouvertures prometteuses de ces travaux, ainsi que les résultats sur le score local de manière générale, seront abordées&nbsp;: application en Maîtrise statistique des Procédés&nbsp;; inférence sur le score local&nbsp;; approximation du nombre de régions de scores dépassant un seuil donné&nbsp;; test multiple...</span> 
 
 
 
*<span style="text-justify:inter-ideograph">18/01/2019&nbsp;: ''Classification des essences arborées à partir de séries temporelles d'images satellitaires''. [http://www.ensat.fr/fr/formations/les-enseignants/david-sheeren.html David Sheeren] (ENSAT, Toulouse).</span>
 
 
 
:
 
::<span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La connaissance précise de la localisation des peuplements forestiers et&nbsp;leur composition en essences est une donnée incontournable pour les&nbsp; gestionnaires réalisant des opérations sylvicoles. C’est aussi un&nbsp;préalable indispensable pour étudier la réponse des forêts au changement&nbsp;climatique et prédire la répartition potentielle des essences dans le&nbsp;futur. Dans cet exposé, je montrerai le potentiel qu'offre les séries&nbsp; temporelles d'images optiques à haute résolution spatiale pour&nbsp;discriminer automatiquement les essences dominantes dans des forêts de&nbsp;feuillus et conifères. Après une présentation des données et de la&nbsp;démarche méthodologique adoptée faisant appel à des techniques&nbsp;d'apprentissage statistique, je décrirai les résultats obtenus sur 9&nbsp;années à partir de séries Formosat-2, leur stabilité inter-annuelle, et&nbsp;l'impact de la prise en compte de l'auto-corrélation spatiale des&nbsp;échantillons sur la performance des modèles. Dans un second temps, un&nbsp;travail spécifique sur la détection de peupleraies avec des données Sentinel-2 sera évoqué, en montrant l'intérêt de l'apprentissage actif&nbsp;pour adapter progressivement le modèle et le rendre exploitable à large échelle.&nbsp;</span> 
 
 
 
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">11/01/2019&nbsp;:&nbsp;''Argumentation Reasoning''.&nbsp;[https://www.irit.fr/~Sylvie.Doutre/ Sylvie Doutre](Université Toulouse 1, UMR IRIT). [https://mia.toulouse.inra.fr/images/1/1d/INRA_MIAT_SeminaireArgumentation_Doutre2019.pdf diaporama]</span></span>
 
 
 
:
 
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Abstract argumentation is an elegant way to tackle reasoning problems in presence of conflicting information. This reasoning model finds applications in various domains such as medicine, law, or agriculture. The seminal paper by Dung defines an argumentation framework as a digraph whose nodes are abstract entities called arguments, and edges are attacks representing the conflicts between these arguments. Several acceptability semantics allow to decide which sets of arguments are accepted, depending on the properties which are expected to be satisfied by a set of arguments to be a rational “outcome” of the framework. Numerous enrichments of Dung’s framework have been proposed, for example, to take into account some supports between arguments besides the attacks, or some preferences between arguments. This talk presents some of these formal frameworks, and addresses a challenging issue that has been addressed in the past few years in this context: the dynamics of abstract argumentation settings</span></span> 
 
 
 
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Exceptionnellement mardi''' 8/01/2019&nbsp;: ''Une méta-analyse transcriptomique identifie une réponse globale aux stress chez la plante modèle Arabidopsis''. [https://www6.inra.fr/mia-paris/Equipes/Membres/Marie-Laure-Martin-Magniette Marie-Laure Martin-Magniette] (MIA Paris & IPS2).</span></span>
 
 
 
:
 
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La réponse des plantes aux stress est contrôlée par de nombreux réseaux d’interactions moléculaires. Au niveau transcriptomique, ces réseaux peuvent être explorés par des approches de «&nbsp;coupable par association&nbsp;» pour identifier des modules fonctionnels contrôlant la physiologie de la plante. La quantité des jeux transcriptomiques disponibles dans les bases de données publiques internationales constituent une ressource génomique importante mais leur diversité peut également être considérée comme une limitation pour des méta-analyses car les jeux de données peuvent être très hétérogènes dans leur construction. Pour limiter cet inconvénient, dans notre projet, nous avons considéré presque 400 comparaisons transcriptomiques décrivant des réponses aux stress de la plante modèle Arabidopsis thaliana, toutes produites au cours des 15 dernières années par la plateforme de notre institut avec des protocoles standardisés (Gagnot et al (2008) NAR 36:D986-90). Ces comparaisons ont été divisées en 18 catégories (9 stress biotiques et 9 stress abiotiques) et pour chaque catégorie, nous avons identifié des groupes de gènes co-exprimés à l’aide d’un modèle de mélange gaussien. Au total, 634 groupes de co-expression ont été identifiés et leur annotation a montré de nombreux enrichissements fonctionnels. Tous les résultats par catégorie de stress sont disponibles dans le module GEM2Net ([https://tools.ips2.u-psud.fr/GEM2NET https://tools.ips2.u-psud.fr/GEM2NET]) de la base de données CATdb (Zaag et al (2015) NAR 43:D1010–D1017). Les analyses de co-expression étant faites par catégorie de stress, nous les avons ensuite intégrées pour construire à l’aide de modèle de mélange de graphes un réseau de co-régulation impliquant 2274 gènes regroupés en 43 communautés stables. Une analyse topologique de ce réseau de co-régulation a permis d’identifier 4 grandes fonctions biologiques et une organisation hiérarchique entre ces 4 grandes fonctions qui est la réponse globale aux stress des plantes. L’objectif de cet exposé est de présenter les différentes étapes de ce projet, la méthodologie employée et l’apport de la modélisation statistique.</span></span> 
 
 
 
<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Pas de séminaire le 28 décembre, ainsi que le 4 janvier (vacances scolaires)'''</span></span>
 
 
 
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">21/12/2018 '''exceptionnellement à 14h'''&nbsp;: ''Retour sur ANITI, le projet d'Institut Interdisciplinaire d'Intelligence Artificielle''. [https://mia.toulouse.inra.fr/Frédérick_GARCIA Frédérick Garcia] (MIAT).</span></span>
 
 
 
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">14/12/2018&nbsp;: ''Les temps de coalescence pour trois gènes permettent de&nbsp;distinguer entre changement de taille et structure''. [https://www.math.univ-toulouse.fr/~grusea/ Simona Grusea] (INSA Toulouse).</span></span>
 
  
:
+
Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué [[Accès_MIAT|ici]] (nous sommes à moins de 30 mètres de la réception&nbsp;!). <!--The seminar of the MIAT Unit of the INRA in Toulouse is a place for scientific and technical exchanges between members of the unit and experts in mathematics, computer science,&#160;agro-ecosystems, bioinformatics ''etc.'' Talks can be on mature ongoing working subjects, on finalized highly specialized projects or have a more informative/educational scope. The focus can be on methodological aspects as well as on applications. Some presentations during other local seminars can be flagged as highly interesting to the usual audience of the MIAT seminar.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La quantité croissante de données génomiques actuellement disponibles élargit les horizons de l'inférence en génétique des populations. Un large éventail de méthodes a été publié permettant de détecter et de dater les changements majeurs dans la taille d'une population au cours de l'histoire de l'espèce. En même temps, il est de plus en plus reconnu que la structure d'une population peut générer des données génétiques similaires à celles générées dans les modèles de changement de taille. Récemment, nous avons montré que, quel que soit le modèle de structure de population, il est toujours possible de trouver un modèle panmictique, avec une fonction particulière de changement de taille, ayant une distribution identique de Tk (le premier temps de coalescence pour un échantillon de taille k). Cela implique que l'on ne peut pas distinguer entre un modèle panmictique et un modèle structuré lorsque nous basons notre analyse uniquement sur un seul temps de coalescence. Je présenterai dans cet exposé un travail récent dans lequel, basé sur une étude analytique de la matrice de taux du processus des lignées ancestrales, nous obtenons de nouveaux résultats théoriques sur la distribution jointe des temps de coalescence T3 et T2 pour un échantillon de trois gènes dans une modèle à n îles symétrique. En particulier, nous montrons que cette distribution est toujours différente de celle obtenue dans une population panmictique, quel que soit le scénario de changement de taille de population. La distribution jointe des temps de coalescence (T3, T2) pour un échantillon de trois gènes contient donc suffisamment d'information pour permettre de distinguer entre une population panmictique et un modèle à n îles symétrique.</span></span>  
+
Presentations can be either in English or in French. According to the presentation, a typical seminar lasts from 45min to a couple of hours. Unless otherwise stated, it is held in the MIAT meeting room at 10.30 on Fridays. Acces to the INRA Auzeville/Castanet, MIAT unit is indicated [[Accès_MIAT|here]] (we're less than 30 meters from the reception&#160;!). -->
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">07/12/2018&nbsp;: ''Recent algorithmic advances for combinatorial optimization in graphical models''. [http://www7.inra.fr/mia/T/degivry/ Simon de Givry] (MIAT).</span></span>
 
  
:
+
== Séminaires de l'année en cours et séminaires futurs ==
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' By representing the constraints and objective function in fac-torized form, graphical models can concisely define various NP-hard combinatorial optimization problems. They are therefore extensively used in several areas of computer science and artificial intelligence. Graphical models can be deterministic or stochastic, optimize a sum or product of local functions, defining a joint cost or probability distribution. Simple transformations exist between these two types of models, but also with MaxSAT and integer programming. During the past ten years, we have been developing a graphical model solver called toulbar2 and we report on a large comparison of exact solvers which are all state-of-the-art for their own target language. We present recent algorithmic advances in toulbar2 including generalized clique cuts and parallel variable neighborhood search methods that make the solver very competitive on several benchmarks coming from probabilistic inference, computer vision and pattern recognition, weighted MaxSAT, and weighted MaxCSP competitions. Solver toulbar2 is available at [http://www.inra.fr/mia/T/toulbar2 http://www.inra.fr/mia/T/toulbar2].</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">30/11/2018&nbsp;: ''Inférence de traits fonctionnels à partir de données métagénomiques par NMF.'' [http://genome.jouy.inra.fr/~splancade/ Sandra Plancade] (INRA MAIAGE, ISBA Louvain)</span></span>
+
==== 15/01/2021&nbsp;: ''Titre à venir.'' [http://evelyne.lutton.free.fr/ Évelyne Lutton] (MIA/ISC-PIF) ====
  
:
+
==== 04/12/2020&nbsp;: ''Journée des doctorants du pôle IMABS'' ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La métagénomique étudie le matériel génétique d'un écosystème bactérien, qui désigne l'ensemble des bactéries présentes dans un milieu donné, dans le but de caractériser l'écosystème et les fonctions qui y sont réalisées, ainsi que leur association avec des phénotypes. Dans ce contexte, la NMF (Nonnegative Matrix Factorization), une technique de réduction de dimension sous contraintes de positivité, permet simultanément la comparaison d'échantillons biologiques et l'inférence de structures existantes dans l'écosystème. Dans cet exposé, je présenterai une méthode d'exploration des voies métaboliques associées au processus de digestion des fibres, à partir de mesures métagénomiques dans l'intestin. Cette approche s’appuie sur la construction préalable d’une liste de traits fonctionnels élémentaires caractérisés par un groupe de gènes microbiens, à partir d’une base d’annotation fonctionnelle rassemblant des connaissances biologiques. Une matrice d'abondances en traits fonctionnels pour un ensemble d’individus est alors calculée à partir de mesures métagénomiques. Le modèle biologique considéré suppose l’existence de voies métaboliques caractérisées par une proportion en chacun des traits fonctionnels, et de profils métaboliques individuels définis par une composition en chacune des voies, ce qui correspond à une décomposition NMF. La modélisation est complétés par des contraintes permettant l'inclusion de connaissances biologiques et biochimiques.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">23/11/2018&nbsp;: ''Viability theory and management of sustainability.&nbsp;'' [http://motive.cemagref.fr/people/guillaume.deffuant Guillaume Deffuant] (IRSTEA, LISC)</span></span>
+
==== 27/11/2020&nbsp;: ''Simulation en recherche médicale. Généralités, exemple et problème connexe.'' [https://perso.math.univ-toulouse.fr/savy/ Nicolas Savy] (IMT) ====
  
:
+
:'''Résumé&nbsp;:''' Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' This talk introduces viability theory and its potential in the management of sustainability. Viability theory addresses the problem of maintaining a dynamical system within a given subset of states, generally called the constraint set. Instead of optimising a criterion, the control strategy thus aims at avoiding crossing the limits of this constraint set. In the case of deterministic dynamics, the main theoretical concept of this theory is the viability kernel. This set includes all states from which there exists a control strategy maintaining the system indefinitely in the constraint set. Different viable control policies can be derived from the viability kernel, which makes this set of high practical interest. The viability kernel has also been used in a mathematical definition of resilience: the resilient states are the ones from which the viability kernel is reachable. Recently, this theory has been completed by other types of sets in a general theory of sustainable management, when making the hypothesis that standard or emergency controls can be applied depending on the situation. The practical application of these theories depends on the algorithms approximating viability kernels and reachable sets, which, unfortunately, face the famous dimensionality curse. The talk finally reports recent progress in improving these algorithms and some remaining challenges.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">16/11/2018&nbsp;: ''How much maths does a biologist need, and vice versa?'' [https://people.csiro.au/R/T/Toni-Reverter-Gomez Toni Reverter-Gomez] (CSIRO, Australie) '''en salle de conférence Marc Ridet'''</span></span>
+
==== 13/11/2020&nbsp;: ''Conception et mise en œuvre d’un système modulaire de mini-bioréacteurs pour la culture continue de microorganismes''. Cyprien Guérin (Inrae, MaIAGE) ====
  
:
+
:'''Résumé'''&nbsp;: Les systèmes de culture continue en bioréacteurs restent, malgré leur intérêt, peu utilisés dans les laboratoires de microbiologie. L’objectif de ce projet de thèse est de faciliter leur mise en œuvre en proposant un nouveau système modulaire de mini-bioréacteurs pilotés par ordinateur en s’appuyant sur les opportunités offertes par l’essor des technologies de fabrication numérique et des microcontrôleurs programmables. Les volumes de culture visés sont de l’ordre de 5 à 10 mL afin de permettre des plans d’expériences complexes pouvant impliquer de nombreux bioréacteurs (en parallèle, en cascade, avec suivi et contrôle en temps réel, ...). Comme preuves de concept, plusieurs applications chez la bactérie Gram-positive ''Bacillus subtilis'' sont envisagées aussi bien dans des contextes d’évolution expérimentale et dirigée que pour des études physiologiques s’appuyant sur de la comparaison de transcriptomes.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Séminaire [https://www6.inra.fr/imabs/ IMABS]'''</span></span> 
 
  
:
+
==== 06/11/2020&nbsp;: ''Titre à venir''. Etienne Delay (CIRAD, GREEN) ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' “Every new body of discovery is mathematical in form, because there is no other guidance we can have” (Charles Darwin, 1809–1882). Biology is now awash with information, often with gigabytes of molecular data (DNA sequences; RNA expression levels; protein, metabolic, and methylation profiles) for each individual in a study. Hidden within this vast mass of data are hopefully strong signals that can be exploited for novel insight, and the search for such signals goes under a number of different names such as bioinformatics and systems biology. A number of molecular biologists are very proficient in generating such data, but only a handful of researchers have the requisite skills to develop and use the next generation of high dimensional statistics needed to find true associations. From a diametrically opposed side, Mathematicians have devoted enormous efforts to develop quantitative theory of the structure, organization, and dynamics of living systems. Questions such as at what speed should humans change from walking to running? Or how should an individual animal divide its resources, between growth and reproduction, to maximize its fitness? Are illuminated by the powerful methods of optimization theory. With a preference for quantitative genetics and genomics, in this seminar I will offer an opinionated overview of positives, and not so positives synergies between biology and mathematics.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Exceptionnellement mercredi''' 7/11/2018&nbsp;: ''Inference for high-dimensional Poisson regression problems.'' [https://www.ceremade.dauphine.fr/~rivoirar/ Vincent Rivoirard] (Université Paris-Dauphine, CEREMADE).</span></span>
+
==== 23-30/10/2020&nbsp;: Pas de séminaire (vacances scolaires) ====
  
:
+
==== 16/10/2020&nbsp;: ''Estimation of species environmental niches and sampling effort from presence only records and illustration on the Pl@ntNet citizen-science flora data''. [http://christophebotella.fr/ Christophe Botella] (LECA) ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Sparse linear regression problems appear in a variety of settings, but often the noise contaminating observations cannot accurately be described as bounded by or arising from a Gaussian distribution. Poisson observations in particular are a characteristic feature of several real-world applications. Previous work on sparse Poisson regression problems encountered several limiting technical hurdles. This talk describes a novel alternative analysis approach for sparse Poisson inverse problems that (a) sidesteps the technical challenges present in previous work, (b) admits estimators that can readily be computed using off-the-shelf LASSO algorithms, and (c) hints at a general weighted LASSO framework for broad classes of problems. At the heart of this new approach lies a weighted LASSO estimator for which data-dependent weights are based on Poisson concentration inequalities. Unlike previous analyses of the weighted LASSO, the proposed analysis depends on conditions which can be checked or shown to hold in general settings with high probability.</span></span> 
 
  
<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Pas de séminaire le 2 novembre (vacances scolaires)'''</span></span>
+
:'''Résumé''': Naturalist mobile applications have been deployed worldwide in the last years and enabled access to a considerable amount of geolocated species presences records. This novel type of data represents a step forward to address ecological and conservation questions through the use of species distribution models (SDMs). However, in the absence of a sampling protocol, the sampling effort often concentrates on specific locations (cities, riverside walks, etc.) located in specific environments, resulting in estimation biases in SDMs. During my PhD, I studied methods to minimize bias in the estimation of inhomogeneous Poisson point processes (IPP) modelling species habitats preferences. I will present two approaches: (i) pooling occurrences from many species, using them as background points in the IPP and conditions under which it yields unbiased estimates, and (ii) the joint modeling of multiple species densities along with a common sampling effort component. Finally, I will show an illustration on Pl@ntNet's citizen science data over the whole French territory, integrating several hundred plant species and hundreds of thousands of observations over France with a highly biased sampling.
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">26/10/2018&nbsp;: ''De la recherche à l'innovation à l'INRA. Exemple du domaine d'Innovation "Agriculture Numérique".'' [https://informatique-mia.inra.fr/biosp/homepage-denis-allard Denis Allard] (BioSP -- CPI Agriculture Numérique, Dept. MIA, INRA)</span></span>
+
==== 09/10/2020&nbsp;: ''Model Exploration in Practice''. [https://iscpif.fr/projects/romain-reuillon/ Romain Reuillon] (CNRS, ISC-PIF) ====
  
:
+
:'''Résumé'''&nbsp;: The use of simulation models has widely spread in recent years, in various fields of academic research. Models are being developed to represent and try to better understand all kinds of systems: population dynamics, epidemics, transportation systems, macro-scale systems, micro-scale systems, etc. In some scientific areas, models and in silico simulations have become essential to help study in vivo situations.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Le domaine d'innovation (DI) "Agriculture de Précision", comme les 15 autres domaines de l'innovation définis à l'INRA sont l'un des éléments de la politique partenariat-transfert-innovation (PTI) mise en place à l'INRA depuis 2015 environ. Après avoir rappeler quelques éléments généraux concernant la PTI de l'INRA, et les missions couvertes par un DI, je détaillerai quelques enjeux de recherche relevant du DI "Agriculture Numérique".</span></span> 
+
: However, simulation models are necessarily a simplification of reality, and hypotheses have to be made when developing a model. Thus every model can (and needs to?) be questioned: Is it relevant to tackle the research question behind it? How to extract significant knowledge from the model? What kind of dynamics can it exhibit? How does each mechanism of the model impact those dynamics? Is every mechanism really necessary? These are just some of the many questions a model developer has to answer in order to really know and understand his/her model!
 +
:This talk focuses on the worldwide zombie epidemic of the past few years. It raises the question of what can modelers say about it, and, it attempts to use model exploration, OpenMOLE (openmole.org) and the associated exploration methodology to build knowledge on this forefront phenomenon.
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">19/10/2018&nbsp;: '''Séminaire remplacé par la soutenance de thèse de A. Imbert''': ''Intégration de données hétérogènes complexes à partir de tableaux de tailles déséquilibrées'' qui débutera à 14h en salle Marc Ridet</span></span>
+
==== 02/10/2020&nbsp;: ''Méthodes mathématiques en écologie''. [https://www.ummisco.fr/?page_id=1150 Tri Nguyen-Huu] (IRD)  ([https://miat.inrae.fr/site/images/7/7e/Pr%C3%A9sentation_MIAT_%28light%29.pdf diaporama]) ====
  
:
+
:'''Résumé'''&nbsp;:   Le développement de modèles mathématiques ont permis d'apporter un point de vue neuf sur des questions écologiques d'ordre général ou bien appliquées. Des modèles abstraits permettent de mieux comprendre les processus régissant certains écosystèmes, tandis que des modèles plus descriptifs permettent d'avoir une vision plus quantitative des phénomènes étudiés. Nous présenterons quelques modèles mathématiques issus des systèmes dynamiques (équations différentielles, équations aux différences finies) et nous intéresserons à ce qu'ils peuvent apporter à l'étude de quelques problèmes écologiques, à savoir la dynamique bio-économique des pêcheries, la connectivité d'espèces marines récifales, et la conservation des grands herbivores dans les parcs nationaux du Kenya.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Les avancées des nouvelles technologies de séquençage ont permis aux études cliniques de produire des données volumineuses et complexes. Cette complexité se décline selon diverses modalités, notamment la grande dimension, l'hétérogénéité des données au niveau biologique (acquises à différents niveaux de l'échelle du vivant et à divers moments de l'expérience), l'hétérogénéité du type de données, le bruit (hétérogénéité biologique ou données entachées d'erreurs) dans les données et la présence de données manquantes (au niveau d'une valeur ou d'un individu entier). L'intégration de différentes données est donc un défi important pour la biologie computationnelle. Cette thèse s'inscrit dans un projet de recherche clinique sur l'obésité, DiOGenes, pour lequel nous avons fait des propositions méthodologiques pour l'analyse et l'intégration de données. Ce projet est basé sur une intervention nutritionnelle menée dans huit pays européens et vise à analyser les effets de différents régimes sur le maintien pondéral et sur certains marqueurs de risque cardio-vasculaire et de diabète, chez des individus obèses. Dans le cadre de ce projet, mes travaux ont porté sur l'analyse de données transcriptomiques (RNA-Seq) avec des individus manquants et sur l'intégration de données transcriptomiques (nouvelle technique QuantSeq) avec des données cliniques. La première partie de cette thèse est consacrée aux données manquantes et à l'inférence de réseaux à partir de données d'expression RNA-Seq. Lors d'études longitudinales transcriptomiques, il arrive que certains individus ne soient pas observés à certains pas de temps, pour des raisons expérimentales. Nous proposons une méthode d'imputation multiple hot-deck (hd-MI) qui permet d'intégrer de l'information externe mesurée sur les mêmes individus et d'autres individus. hd-MI permet d'améliorer la qualité de l'inférence de réseau. La seconde partie porte sur une étude intégrative de données cliniques et transcriptomiques (mesurées par QuantSeq) basée sur une approche réseau. Nous y montrons l'intérêt de cette nouvelle technique pour l'acquisition de données transcriptomiques et l'analysons par une approche d'inférence de réseau en lien avec des données cliniques d'intérêt.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">12/10/2018&nbsp;: ''Inférence de données de réseaux multipartites par modèles à blocs latents et stochastiques. Application en écologie et ethnobiologie.'' [https://www6.inra.fr/mia-paris/Equipes/Membres/Sophie-Donnet Sophie Donnet] (MIA Paris, INRA)</span></span>
+
==== 25/09/2020&nbsp;: ''Learning with pangenomes''. [https://lbbe.univ-lyon1.fr/-Jacob-Laurent-.html?lang=fr Laurent Jacob] (CNRS, LBBE) ====
  
:
+
:'''Résumé'''&nbsp;: As the number and variety of sequenced genomes grows, representing them by comparison to a single reference leads to an increasing level of approximation, discarding accessory genes, rearrangements and repeated regions. This problem is particularly acute when studying microbial genomes or metagenomes, and hinders essential statistical tasks such as GWAS or prediction in this context. I will discuss genome representations which are well suited to statistical analysis when genomes are ill-suited to alignment or even assembly.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Modéliser les relations entre entités (individus, insectes, plantes...) est une problématique classique en sciences sociales et en écologie et regrouper les entités étudiées en fonction des motifs observés dans le réseau permet de comprendre la topologie du réseau. Les modèle à blocs stochastiques ou latents sont une approche répandue pour regrouper les individus partageant le même comportement d'interaction. Dans ce travail, nous nous intéressons au cas où nous cherchons à modéliser des réseaux multipartites, i.e. des réseaux dans lesquels les entités appartiennent à des groupes fonctionnels prédéfinis. Les modèles à blocs stochastiques ou latents reposent sur l'introduction des variables latentes, rendant leur vraisemblance incalculable de façon explicite dès que la taille des réseaux augmente. Nous utilisons alors une version stochastique de l'algorithme EM. La pertinence de notre modèle et de notre méthode d'inférence est illustrée sur données simulées et réelles.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">05/10/2018&nbsp;: ''Input output kernel regression for protein-protein interaction&nbsp;prediction and metabolite identification''. Céline Brouard (INRA, MIAT) [https://mia.toulouse.inra.fr/images/6/66/Seminaire.pdf diaporama]</span></span>
+
==== 18/09/2020&nbsp;: ''Partager de l'information pour faire face à un virus. Etude de cas en ostréiculture via un modèle multi-agent.'' Nicolas Paget (CIRAD) ====
  
:
+
:'''Résumé'''&nbsp;: Le postulat selon lequel le partage d'information permet de meilleures prises de décisions est fortement ancré. En développant un modèle multi-agent sur la plateforme Cormas, nous avons questionné ce postulat. Depuis quelques années, les ostréiculteurs font face à un virus (os-hv1) au fort taux de létalité. Ce virus n'est que mal connu. Dans le modèle, les agents, de rationalités variées, partagent leurs expériences et en tirent des leçons pour leurs pratiques. Nous étudions alors le type de décision prise par les agents en fonction de scénarios de partage de l'informations et d'hétérogénéité des agents. Les résultats montrent que l'hétérogénéité des agents permet une meilleure exploration de l'espace des possibles et qu'un partage et une interprétation trop radicaux des expériences de chacun à un effet contreproductif. Ce travail a été effectué en thèse. Lors de cette présentation, j'évoquerai aussi des travaux ou pistes de travaux plus récents ou en cours d'initialisation dans l'idée de susciter des collaborations.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Many real world learning tasks require predicting outputs that&nbsp;correspond to complex structured objects or to multiple interdependent&nbsp;outputs. Structured prediction approaches making use of the statistical&nbsp; dependencies between the output parts, have been shown to achieve an&nbsp;improved prediction performance in several applications. I will present&nbsp; a kernel-based structured output prediction approach, called Input&nbsp;Output Kernel Regression. In this approach the internal structure of the&nbsp;output data is encoded using a kernel function, that measures the&nbsp;similarity between two outputs. This approach is based on the idea of&nbsp; using the kernel trick in the output space and making predictions in a&nbsp;feature space associated with the output kernel. I will focus in my presentation on two applications of this work. The&nbsp;first application is the prediction of protein-protein interactions.&nbsp;Another application will be presented on the metabolite identification&nbsp;problem, that consists in determining the molecular structure of an&nbsp; unknown metabolite from tandem mass spectrometry data.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">28/09/2018&nbsp;: ''La plateforme Souk.'' [http://homepages.laas.fr/gtredan/ Gilles Tredan] (LAAS, Toulouse)</span></span>
+
==== 11/09/2020&nbsp;: ''Thigmoimmunité végétale. Comment la mécanoperception participe à la réponse immunitaire''. Adelin Barbacci (LIPM) ====
  
:
+
:'''Résumé'''&nbsp;: Les attaques de parasites sont responsables chaque année de pertes de récolte considérables à travers le monde. La recherche de sources génétiques de résistance durable chez les plantes constitue un levier important pour répondre à la demande alimentaire mondiale. ''Sclerotinia sclerotiorum'' est le champignon pathogène responsable de la maladie de la pourriture blanche sur plus de 400 espèces végétales, causant plusieurs millions d’euros de pertes de récolte chaque année, notamment sur colza. Comme la majorité des agents pathogènes, ''S. sclerotiorum'' utilise la sécrétion de molécules effectrices pour manipuler la physiologie des plantes hôtes et favoriser son développement. La mise en place de la QDR est consécutive à la perception du champignon. Toutefois, contrairement à la résistance gène-pour-gène plus largement étudiée, la QDR mobilise de nombreux réseaux de gènes qui sont encore méconnus et ne sont pas tous spécifiquement dédiés à l’immunité. Or, l'interaction plante-champignon met en jeu des signaux mécaniques importants, intrinsèques à la pénétration des tissus de l’hôte.
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Depuis 2012, une partie de nos recherches porte sur la caractérisation des structures d’interaction sociales. Nous avons pour cela développé une plateforme d’observation sociale des «&nbsp;cinétiques&nbsp;» humaines&nbsp;: SOUK (Social Observation of hUman Kinetics). Le principe de cette plateforme est de pouvoir collecter avec une grande précision spatiale et temporelle la position des individus d’une foule dense. SOUK fonctionne à la manière d’un GPS inversé plutôt précis (15cm) et rapide (1-4 hz). Grâce à ce système, il est possible de suivre le déplacement de groupes d'individus (jusqu60 personnes) dans des espaces délimités, et d’analyser les mobilités et interactions au sein de ces groupes. Cet outil a été déployé lors de plusieurs campagnes expérimentales à Toulouse et à Milan dans des contextes variés&nbsp;: personnes dans une foule, danseurs, évènements sociaux (buffets), animaux au sein d’un troupeau... Lors de cette présentation a vocation panoramique, j'aborderai quelques résultats et perspectives issus de l’analyse des données ainsi collectées.</span></span> 
+
:Au cours de ces deux dernières années nous avons réussi à montrer que les signaux mécaniques jouent un rôle de premier plan dans la mise en place de la réponse immunitaire et qu’il était possible de moduler fortement le niveau de résistance des plantes grâce à des ondes mécaniques. Ce travail est le fruit d’une collaboration étroite entre des équipes de physique (Aroune Duclos Laboratoire d’Acoustique de l’Université du Mans), de physiologie végétale (Nathalie Leblanc-Fournier INRA PIAF Clermont, Tou-Cheu Xiong INRA BPMP Montpellier) de biologie moléculaire (Adelin Barbacci LIPM) et de modélisation mathématique et informatique (Frédérick Garcia MIAT). C’est également le point de départ de la thèse de Khaoula Hadj-Amor coencadrée par MIAT et le LIPM. L’exposé s’attachera à présenter nos aventures entre mécanoperception, proprioception et réponse immunitaire.
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">21/09/2018&nbsp;: ''Données de la recherche… Vers l’ouverture'' Nathalie Gandon (CODIR - Département MIA, INRA) [https://mia.toulouse.inra.fr/images/8/87/SeminaireNathalieGandon.pdf diaporama]</span></span>
+
== Séminaires reportés à une date ultérieure ==
  
:
+
==== ''Optimal convergence rates for Nesterov acceleration.'' [https://perso.math.univ-toulouse.fr/rondepierre/ Aude Rondepierre] (INSA/IMT) ====
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' Présentation des contextes (international, national et institutionnel), du cadre juridique et des offres de service inra autour de l’open data.</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">14/09/2018&nbsp;: ''Inférence des causes de la reprogrammation cellulaire par abduction'' [https://ibisc.univ-evry.fr/~delapla/ Franck Delaplace] (IBISC, Université d'Evry) [https://mia.toulouse.inra.fr/images/c/ce/Abduction-slide-print-FD.pdf diaporama]</span></span>
+
:'''Résumé&nbsp;:''' In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
 +
:This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.
  
:
 
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' La médecine de réseau a pour objectif de définir la maladie à l’échelle des réseaux biologiques afin de mieux comprendre les mécanismes causaux de celle-ci. Des études dans ce domaine ont montré que la reprogrammation comportementale observée dans des maladies complexes telles que le cancer est causée par une modification du câblage du réseau moléculaire. La transition entre cellule saine et malade et inversement peuvent s'interpréter à l'échelle moléculaire comme une reprogrammation cellulaire induite par des perturbations topologiques des réseaux moléculaires induisant des changements du destin cellulaire. Pour la modélisation, l’objectif est d’inférer les actions topologiques sur un réseau induisant une variation de la dynamique incarnant ces transitions. Nous proposons un cadre théorique étendant les réseaux Booléens, appelé ''réseau booléen contrôlé'' où les actions de réseau topologique sont définies comme des contrôles de la dynamique. Sur la base de ce cadre, nous présentons un nouvel algorithme utilisant des principes de raisonnement abductif qui infère les perturbations causales minimales conduisant à un comportement attendu aux états stables de la dynamique. Ce cadre de modélisation s’applique à priori à un grand nombre de situation biologique d’alteration du destin cellulaire reposant sur sa reprogrammation. Nous l’illustrerons sur un modèle du cancer du sein, que nous considérons comme une preuve de concept, en inférant à la fois les oncogènes, les suppresseurs de tumeurs et des cibles thérapeutiques. ''Travail joint avec Célia Biane''</span></span> 
 
  
*<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">7/09/2018&nbsp;: ''SAA-ILP approach for multi-objective landscape optimization under uncertainty: theory and application'' [https://yanndujardinsite.wordpress.com/ Yann Dujardin] (MIAT)</span></span>
+
====  ''KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows''. [https://imag.umontpellier.fr/~charlier/ Benjamin Charlier] (Université de Montpellier, ARAMIS)====
  
:
+
:'''Résumé&nbsp;:''' The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula. It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
::<span style="text-justify:inter-ideograph"><span style="text-justify:inter-ideograph">'''Résumé&nbsp;:''' ''Theory:'' The Graph-based Markov Decision Process (GMDP) framework forms a class of MDP with factored state and action spaces, which has been studied for the past ten years. Since state and action spaces share the same graphical structure, it may be useful to model the control of spatial processes or collaborative multi-agent decision problems with local interactions. The concept of local policies in GMDP is especially useful, since it leads to interpretable objects, unlike optimal global policies which usually require exponential space to represent. Several time efficient algorithms to compute approximate local policies in GMDP have been proposed in the last decade. On the other hand, while efficient in practice, existing algorithms come without any performance guarantee on the returned local policies. Furthermore, while real-world collaborative decision problems modeled by GMDP generally contain several objectives to be optimized, no attention has been given yet, to our knowledge, to multi-objective GMDP. Our first contribution is to propose a Sample Average Approximation (SAA) approach for GMDP combined with an original ILP formulation. Unlike existing algorithms for GMDP, we provide theoretical hardness results and performance guarantees. Then, we show how the SAA-ILP approach can model and solve multi-objective GMDP. ''Application:'' An agricultural landscape can be devised according to various criteria,often antagonist (all of them cannot be optimized simultaneously). When managing agro-ecosystems, finding "good compromise" solutions between these criteria is therefore&nbsp;critical. However, finding landscape management strategies that enable to reach satisfying trade-offs on different criteria is difficult for several reasons: 1) the processes involved in these strategies making are spatio-temporal processes, 2) decision must been made under uncertainty, 3) modeling and solving multi-objective optimization problems is more difficult that mono-objective ones. We consider the problem of finding best compromise solutions to a particular multi-objective landscape management problem under uncertainty. Possible decisions consist in assigning a sequence of cultures, over a time horizon, to every site of an agricultural network. These sequences will directly influence three criteria: total profit, biodiversity, and equity between the stakeholders. Sequences also influence pollinators dynamics, the position of which can itself influence the criteria in another way. Criteria are computed over a time horizon. The dynamics of the pollinators are spatio-temporal and subject to uncertainty. To solve this problem, we propose a multi-objective SAA-ILP-based solver that allows a decision-maker to interactively discover the agricultural landscape that corresponds to a (subjective) best compromise between the criteria.</span></span>
+
:KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU. KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
 +
:Web site: http://www.kernel-operations.io
  
== Séminaires passés / Past seminars &nbsp;: ==
+
== Séminaires passés / Past seminars ==
  
 
Lien vers la [[List_of_past_seminars|Liste des séminaires passés]] de l'unité MIAT.
 
Lien vers la [[List_of_past_seminars|Liste des séminaires passés]] de l'unité MIAT.
  
== Contacts: ==
+
== Contacts ==
  
Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter [mailto:patrick(dot)taillandier(at)toulouse(dot)inra(dot)fr Patrick Taillandier] ou [mailto:matthias(dot)zytnicki(at)toulouse(dot)inra(dot)fr Matthias Zytnicki].
+
Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter [mailto:patrick(dot)taillandier(at)inra(dot)fr Patrick Taillandier] ou [mailto:matthias(dot)zytnicki(at)inra(dot)fr Matthias Zytnicki].

Version du 14 octobre 2020 à 08:16

Sommaire

Séminaires de l'unité MIAT

Pyrenees-morning.jpg

Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.

Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué ici (nous sommes à moins de 30 mètres de la réception !).


Séminaires de l'année en cours et séminaires futurs

15/01/2021 : Titre à venir. Évelyne Lutton (MIA/ISC-PIF)

04/12/2020 : Journée des doctorants du pôle IMABS

27/11/2020 : Simulation en recherche médicale. Généralités, exemple et problème connexe. Nicolas Savy (IMT)

Résumé : Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.

13/11/2020 : Conception et mise en œuvre d’un système modulaire de mini-bioréacteurs pour la culture continue de microorganismes. Cyprien Guérin (Inrae, MaIAGE)

Résumé : Les systèmes de culture continue en bioréacteurs restent, malgré leur intérêt, peu utilisés dans les laboratoires de microbiologie. L’objectif de ce projet de thèse est de faciliter leur mise en œuvre en proposant un nouveau système modulaire de mini-bioréacteurs pilotés par ordinateur en s’appuyant sur les opportunités offertes par l’essor des technologies de fabrication numérique et des microcontrôleurs programmables. Les volumes de culture visés sont de l’ordre de 5 à 10 mL afin de permettre des plans d’expériences complexes pouvant impliquer de nombreux bioréacteurs (en parallèle, en cascade, avec suivi et contrôle en temps réel, ...). Comme preuves de concept, plusieurs applications chez la bactérie Gram-positive Bacillus subtilis sont envisagées aussi bien dans des contextes d’évolution expérimentale et dirigée que pour des études physiologiques s’appuyant sur de la comparaison de transcriptomes.

06/11/2020 : Titre à venir. Etienne Delay (CIRAD, GREEN)

23-30/10/2020 : Pas de séminaire (vacances scolaires)

16/10/2020 : Estimation of species environmental niches and sampling effort from presence only records and illustration on the Pl@ntNet citizen-science flora data. Christophe Botella (LECA)

Résumé: Naturalist mobile applications have been deployed worldwide in the last years and enabled access to a considerable amount of geolocated species presences records. This novel type of data represents a step forward to address ecological and conservation questions through the use of species distribution models (SDMs). However, in the absence of a sampling protocol, the sampling effort often concentrates on specific locations (cities, riverside walks, etc.) located in specific environments, resulting in estimation biases in SDMs. During my PhD, I studied methods to minimize bias in the estimation of inhomogeneous Poisson point processes (IPP) modelling species habitats preferences. I will present two approaches: (i) pooling occurrences from many species, using them as background points in the IPP and conditions under which it yields unbiased estimates, and (ii) the joint modeling of multiple species densities along with a common sampling effort component. Finally, I will show an illustration on Pl@ntNet's citizen science data over the whole French territory, integrating several hundred plant species and hundreds of thousands of observations over France with a highly biased sampling.

09/10/2020 : Model Exploration in Practice. Romain Reuillon (CNRS, ISC-PIF)

Résumé : The use of simulation models has widely spread in recent years, in various fields of academic research. Models are being developed to represent and try to better understand all kinds of systems: population dynamics, epidemics, transportation systems, macro-scale systems, micro-scale systems, etc. In some scientific areas, models and in silico simulations have become essential to help study in vivo situations.
However, simulation models are necessarily a simplification of reality, and hypotheses have to be made when developing a model. Thus every model can (and needs to?) be questioned: Is it relevant to tackle the research question behind it? How to extract significant knowledge from the model? What kind of dynamics can it exhibit? How does each mechanism of the model impact those dynamics? Is every mechanism really necessary? These are just some of the many questions a model developer has to answer in order to really know and understand his/her model!
This talk focuses on the worldwide zombie epidemic of the past few years. It raises the question of what can modelers say about it, and, it attempts to use model exploration, OpenMOLE (openmole.org) and the associated exploration methodology to build knowledge on this forefront phenomenon.

02/10/2020 : Méthodes mathématiques en écologie. Tri Nguyen-Huu (IRD) (diaporama)

Résumé : Le développement de modèles mathématiques ont permis d'apporter un point de vue neuf sur des questions écologiques d'ordre général ou bien appliquées. Des modèles abstraits permettent de mieux comprendre les processus régissant certains écosystèmes, tandis que des modèles plus descriptifs permettent d'avoir une vision plus quantitative des phénomènes étudiés. Nous présenterons quelques modèles mathématiques issus des systèmes dynamiques (équations différentielles, équations aux différences finies) et nous intéresserons à ce qu'ils peuvent apporter à l'étude de quelques problèmes écologiques, à savoir la dynamique bio-économique des pêcheries, la connectivité d'espèces marines récifales, et la conservation des grands herbivores dans les parcs nationaux du Kenya.

25/09/2020 : Learning with pangenomes. Laurent Jacob (CNRS, LBBE)

Résumé : As the number and variety of sequenced genomes grows, representing them by comparison to a single reference leads to an increasing level of approximation, discarding accessory genes, rearrangements and repeated regions. This problem is particularly acute when studying microbial genomes or metagenomes, and hinders essential statistical tasks such as GWAS or prediction in this context. I will discuss genome representations which are well suited to statistical analysis when genomes are ill-suited to alignment or even assembly.

18/09/2020 : Partager de l'information pour faire face à un virus. Etude de cas en ostréiculture via un modèle multi-agent. Nicolas Paget (CIRAD)

Résumé : Le postulat selon lequel le partage d'information permet de meilleures prises de décisions est fortement ancré. En développant un modèle multi-agent sur la plateforme Cormas, nous avons questionné ce postulat. Depuis quelques années, les ostréiculteurs font face à un virus (os-hv1) au fort taux de létalité. Ce virus n'est que mal connu. Dans le modèle, les agents, de rationalités variées, partagent leurs expériences et en tirent des leçons pour leurs pratiques. Nous étudions alors le type de décision prise par les agents en fonction de scénarios de partage de l'informations et d'hétérogénéité des agents. Les résultats montrent que l'hétérogénéité des agents permet une meilleure exploration de l'espace des possibles et qu'un partage et une interprétation trop radicaux des expériences de chacun à un effet contreproductif. Ce travail a été effectué en thèse. Lors de cette présentation, j'évoquerai aussi des travaux ou pistes de travaux plus récents ou en cours d'initialisation dans l'idée de susciter des collaborations.

11/09/2020 : Thigmoimmunité végétale. Comment la mécanoperception participe à la réponse immunitaire. Adelin Barbacci (LIPM)

Résumé : Les attaques de parasites sont responsables chaque année de pertes de récolte considérables à travers le monde. La recherche de sources génétiques de résistance durable chez les plantes constitue un levier important pour répondre à la demande alimentaire mondiale. Sclerotinia sclerotiorum est le champignon pathogène responsable de la maladie de la pourriture blanche sur plus de 400 espèces végétales, causant plusieurs millions d’euros de pertes de récolte chaque année, notamment sur colza. Comme la majorité des agents pathogènes, S. sclerotiorum utilise la sécrétion de molécules effectrices pour manipuler la physiologie des plantes hôtes et favoriser son développement. La mise en place de la QDR est consécutive à la perception du champignon. Toutefois, contrairement à la résistance gène-pour-gène plus largement étudiée, la QDR mobilise de nombreux réseaux de gènes qui sont encore méconnus et ne sont pas tous spécifiquement dédiés à l’immunité. Or, l'interaction plante-champignon met en jeu des signaux mécaniques importants, intrinsèques à la pénétration des tissus de l’hôte.
Au cours de ces deux dernières années nous avons réussi à montrer que les signaux mécaniques jouent un rôle de premier plan dans la mise en place de la réponse immunitaire et qu’il était possible de moduler fortement le niveau de résistance des plantes grâce à des ondes mécaniques. Ce travail est le fruit d’une collaboration étroite entre des équipes de physique (Aroune Duclos Laboratoire d’Acoustique de l’Université du Mans), de physiologie végétale (Nathalie Leblanc-Fournier INRA PIAF Clermont, Tou-Cheu Xiong INRA BPMP Montpellier) de biologie moléculaire (Adelin Barbacci LIPM) et de modélisation mathématique et informatique (Frédérick Garcia MIAT). C’est également le point de départ de la thèse de Khaoula Hadj-Amor coencadrée par MIAT et le LIPM. L’exposé s’attachera à présenter nos aventures entre mécanoperception, proprioception et réponse immunitaire.

Séminaires reportés à une date ultérieure

Optimal convergence rates for Nesterov acceleration. Aude Rondepierre (INSA/IMT)

Résumé : In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.


KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows. Benjamin Charlier (Université de Montpellier, ARAMIS)

Résumé : The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula. It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU. KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
Web site: http://www.kernel-operations.io

Séminaires passés / Past seminars

Lien vers la Liste des séminaires passés de l'unité MIAT.

Contacts

Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter Patrick Taillandier ou Matthias Zytnicki.

Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels