Séminaires : Différence entre versions

De MIAT INRA
Aller à : navigation, rechercher
(26/06/2020 : Titre à venir. Anne Goelzer (INRAE/MaIAGE/BioSys))
(15/01/2021 : Titre à venir. Évelyone Lutton (MIA/ISC-PIF))
(44 révisions intermédiaires par 4 utilisateurs non affichées)
Ligne 8 : Ligne 8 :
 
Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué [[Accès_MIAT|ici]] (nous sommes à moins de 30 mètres de la réception&nbsp;!). <!--The seminar of the MIAT Unit of the INRA in Toulouse is a place for scientific and technical exchanges between members of the unit and experts in mathematics, computer science,&#160;agro-ecosystems, bioinformatics ''etc.'' Talks can be on mature ongoing working subjects, on finalized highly specialized projects or have a more informative/educational scope. The focus can be on methodological aspects as well as on applications. Some presentations during other local seminars can be flagged as highly interesting to the usual audience of the MIAT seminar.  
 
Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué [[Accès_MIAT|ici]] (nous sommes à moins de 30 mètres de la réception&nbsp;!). <!--The seminar of the MIAT Unit of the INRA in Toulouse is a place for scientific and technical exchanges between members of the unit and experts in mathematics, computer science,&#160;agro-ecosystems, bioinformatics ''etc.'' Talks can be on mature ongoing working subjects, on finalized highly specialized projects or have a more informative/educational scope. The focus can be on methodological aspects as well as on applications. Some presentations during other local seminars can be flagged as highly interesting to the usual audience of the MIAT seminar.  
 
Presentations can be either in English or in French. According to the presentation, a typical seminar lasts from 45min to a couple of hours. Unless otherwise stated, it is held in the MIAT meeting room at 10.30 on Fridays. Acces to the INRA Auzeville/Castanet, MIAT unit is indicated [[Accès_MIAT|here]] (we're less than 30 meters from the reception&#160;!). -->
 
Presentations can be either in English or in French. According to the presentation, a typical seminar lasts from 45min to a couple of hours. Unless otherwise stated, it is held in the MIAT meeting room at 10.30 on Fridays. Acces to the INRA Auzeville/Castanet, MIAT unit is indicated [[Accès_MIAT|here]] (we're less than 30 meters from the reception&#160;!). -->
 
&nbsp;
 
 
 
  
  
 
== Séminaires de l'année en cours et séminaires futurs ==
 
== Séminaires de l'année en cours et séminaires futurs ==
  
==== ''Séminaire reporté''&nbsp;: ''Optimal convergence rates for Nesterov acceleration.'' [https://perso.math.univ-toulouse.fr/rondepierre/ Aude Rondepierre] (INSA/IMT) ====
+
==== 15/01/2021&nbsp;: ''Titre à venir.'' [http://evelyne.lutton.free.fr/ Évelyne Lutton] (MIA/ISC-PIF) ====
 
 
:
 
::'''Résumé&nbsp;:''' In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
 
 
 
::This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.
 
 
 
 
 
==== ''Séminaire reporté''&nbsp;: ''Simulation en recherche médicale. Généralités, exemple et problème connexe.'' [https://perso.math.univ-toulouse.fr/savy/ Nicolas Savy] (IMT) ====
 
 
 
:
 
::'''Résumé&nbsp;:''' Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.
 
 
 
 
 
 
 
==== ''Séminaire reporté''&nbsp;: ''Titre à venir''. Adelin Barbacci (LIPM) ====
 
 
 
 
 
====  ''Séminaire reporté''&nbsp;: ''KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows''. [https://imag.umontpellier.fr/~charlier/ Benjamin Charlier] (Université de Montpellier, ARAMIS)====
 
 
 
:
 
::'''Résumé&nbsp;:''' The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula.  It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
 
 
 
::KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU.  KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
 
 
 
::Web site: http://www.kernel-operations.io
 
 
 
==== 26/06/2020&nbsp;: ''Titre à venir''. [https://maiage.inrae.fr/fr/biosys Anne Goelzer] (INRAE/MaIAGE/BioSys) ====
 
 
 
:'''Résumé'''&nbsp;: À venir.
 
 
 
==== 19/06/2020&nbsp;: ''Sensitivity analysis with generalized chaos expansion''. [https://olivier-roustant.fr/ Olivier Roustant] (INSA/IMT) ====
 
 
 
::'''Résumé'''&nbsp;: ''cf'' [https://projecteuclid.org/euclid.ejs/1579662085 Project Eclid]. The so-called polynomial chaos expansion is widely used in computer experiments. For example, it is a powerful tool to estimate Sobol’ sensitivity indices. In this paper, we consider generalized chaos expansions built on general tensor Hilbert basis. In this frame, we revisit the computation of the Sobol’ indices with Parseval equalities and give general lower bounds for these indices obtained by truncation. The case of the eigenfunctions system associated with a Poincaré differential operator leads to lower bounds involving the derivatives of the analyzed function and provides an efficient tool for variable screening. These lower bounds are put in action both on toy and real life models demonstrating their accuracy.
 
 
 
==== 05/06/2020&nbsp;: ''Apports de l'informatique et de la fouille de données à l'agriculture.'' [https://www6.toulouse.inrae.fr/agir/Les-equipes/VASCO/Membres/David-Camilo-Corrales-Munoz David-Camilo Corrales-Munoz] (AGIR, VASCO) ([https://www.dropbox.com/s/mlxy28vnajxntbt/Presentattion-INRAE-Panoramique.pdf?dl=0 diaporama])====
 
 
 
::'''Résumé'''&nbsp;:  Les acteurs du monde agricoles doivent prendre quotidiennement de très nombreuses décisions de tous ordres. Une question essentielle est l'estimation précise des rendements des cultures. L’informatique et la science des données, en particulier la fouille de données, contribuent fortement à l’aide à la décision. Dans cette présentation, différentes études de cas mobilisant la fouille de données appliquée à l'agronomie seront présentées. Par ailleurs, différentes approches d'intelligence artificielle potentiellement utiles à l’agriculture seront également abordées.
 
 
 
==== Supprimé pour cause de COVID&nbsp;: ''Approches “deep learning” pour la prédiction d’interactions protéine-protéine''. [http://lamoureuxlab.org/ Guillaume Lamoureux] (Rutgers University) ====
 
 
 
:
 
::'''Résumé&nbsp;:''' Pour comprendre les détails moléculaires d'un processus biologique, il faut généralement connaître la structure tridimensionnelle d’un grand nombre de complexes protéine-ligand et protéine-protéine. Comme très peu de ces structures sont connues expérimentalement, il est habituellement nécessaire de les prédire à l’aide de méthodes computationnelles dont la fiabilité et la transférabilité restent à améliorer.
 
 
 
::Je présenterai nos récents travaux axés sur le développement de modèles “deep learning” reliant séquence, structure, et fonction de protéines. Suivant une approche unifiée dite “end-to-end”, ces modèles visent à découvrir de nouvelles représentations moléculaires utiles à la fois pour prédire la fonction d’une protéine à partir de sa structure, et la structure d’une protéine à partir de sa séquence. Bien que nos intérêts actuels portent sur la prédiction de structure de protéines et d'interactions protéine-protéine, les modèles développés sont généralisables à toute autre classe de biomolécules.
 
 
 
==== 13/03/2020&nbsp;: ''Inférence de réseaux de régulation de gènes à partir de données transcriptomiques et génomiques d'hybrides de tournesol''. Lise Pomiès (MIAT) ====
 
 
 
:
 
::'''Résumé&nbsp;:''' Dans le cadre du projet SUNRISE, nous étudions la réponse du tournesol à la sécheresse combinée au phénomène d'hétérosis. Pour cela, nous disposons, pour un pool de  350 hybrides de tournesol, de l'expression de 180 gènes impliqués dans l'hétérosis et/ou la sécheresse ainsi que des SNP présents sur ces différents hybrides. Nous avons créés différents jeux de données artificiels possédant des caractéristiques biologiques proches de notre jeux de données mesuré afin de trouver la méthode d'inférence la mieux adaptée. Cette méthode a ensuite été appliquée sur les données mesurées.
 
 
 
==== 06/03/2020&nbsp;: ''Inférence démographique en génétique des populations : comment tenir compte de la structure ?'' [https://www.math.univ-toulouse.fr/~omazet/ Olivier Mazet] (Institut de Mathématiques de Toulouse) ====
 
 
 
:
 
::'''Résumé&nbsp;:''' Après un rappel des modèles mathématiques issus du coalescent de Kingman, je présenterai quelques méthodes d'inférence démographique devenues classiques (PSMC, MSMS), leurs limites pour ce qui est de l'hypothèse de structuration de la population, et nos dernières avancées pour tenter de dépasser ces limites.
 
 
 
==== Pas de séminaire le 28 février ([https://www6.inra.fr/imabs/Evenements/Seminaires/Journee-IA-Agriculture Journée IA & Agriculture]) ====
 
 
 
==== Pas de séminaire le 14 et le 21 février (vacances scolaires) ====
 
 
 
==== 07/02/2020&nbsp;: ''Favoriser la ré-utilisations de données publiques en transcriptomique et épigénomique par des visualisations interactives''. [https://gdevailly.netlify.com/ Guillaume Devailly] (GenPhySE) ====
 
 
 
:
 
::'''Résumé&nbsp;:''' Un neurone, un adipocyte et une cellule du foie partagent le même génome et sont issu de la même cellule œuf, mais présentent des aspects radicalement différents. Ces différences résultent d’une expression différentielle des gènes dans chaque type cellulaire, mise en place par la combinaison de signaux extérieurs à la cellule (environnement, signalisation hormonale, métabolites circulants, etc.) et par le remodelage de la chromatine en domaines favorisant ou défavorisant l’expression de tels ou tels gènes.
 
 
 
::L’étude de la transcription et de l’épigénome des différents types cellulaire a abouti à la production massive de données de séquençage haut-débit par des consortiums internationaux (ENCODE, Roadmap Epigenomics, FAANG, etc.) et de multiples laboratoires. De nombreux jeux de données sont disponibles publiquement, mais les données sont lourdes, complexes à analyser, et très sensibles à différents biais expérimentaux et d’analyses, ce qui décourage leur réutilisation.
 
 
 
::Nous avons commencé à offrir des visualisations interactives de données publiquement disponibles au travers d’applications web : http://www.heatstarseq.roslin.ed.ac.uk/ (matrices de corrélations entre expériences) et https://joshiweb.cbu.uib.no/perepigenomics_app/ (liens entre marques épigénétique et régulation de la transcription) et allons proposer d’offrir directement de genre de visualisations sur le portail de données FAANG dans le cadre du projet VizFaDa.
 
 
 
==== 31/01/2020&nbsp;: ''A GDEC-MIAT collaboration on ncRNA annotation on wheat CNSs region - the FR5BS project''. [https://cnrgv.toulouse.inrae.fr/fr/content/view/full/1623 Philippe Leroy] (GDEC) ====
 
 
 
:
 
::'''Résumé&nbsp;:''' Wheat (''Triticum aestivum L.'') is the most widely cultivated crop on Earth, an important crop contributing about a fifth of the total calories consumed by humans. Consequently, wheat yields and production affect the global economy, and failed harvests can lead to social unrest (IWGSC Science (2018) 361:661). The first coordinated efforts towards obtaining a reference wheat genome date to 2005, when the International Wheat Genome Sequencing Consortium (IWGSC) was established (Tulpova et al. (2019) New BIOTECHNOLOGY 48:12–19). Fortunately, since August 2018, the IWGSC RefSeq v1.0 assembly of pseudomolecules provided a high-quality linear assembly of each chromosome from one terminal region through the centromere to the other terminal region in the form of 70 to 80 super-scaffolds per chromosome (Keeble-Gagnère et al. Genome Biology (2018) 19:112). Consequently, the IWGSC data repository, URGI (INRA research unit in genomics and bioinformatics dedicated to plants and crop parasites) provides tools and browsers to explore wheat genomics data and the IWGSC RefSeq v1.0 assembly. Furthermore, the RefSeq v2.0 assembly is now available to download at INRA URGI since July 2019 (https://wheat-urgi.versailles.inra.fr/Seq-Repository/Assemblies. Moreover, very recently, the 10+ Wheat Genome Project (http://www.10wheatgenomes.com) has released several more wheat new genome reference sequences that can be download from this site: https://webblast.ipk-gatersleben.de/wheat_ten_genomes/.
 
 
 
::Therefore, we have nowadays a huge amount of resources to study wheat genome structure and dynamic evolution. In this context, the WheatOMICS project (https://www.france-genomique.org/projet/wheatomics/) aims at harnessing the latest NGS technologies to unravel the genomic-transcriptomic-epigenomic variations (DNA-seq, RNA-seq, ChIP-Seq, BS-seq) driving phenotypic response to biotic and abiotic constraints on five important genotypes (Chinese Spring, Renan, Recital, Courtot, Apache) for the research groups of the INRAE GDEC Unit, in France. These researches will deliver new highly strategic knowledge as key regulators to improve current wheat pre-breeding scheme for key agronomical traits. Furthermore, one of this genotype (Renan) has been selected to produce a new high quality reference genome sequence based on long-reads sequence data and optical maps (BioNano). Since we may have in the future new wheat genome assemblies to assess, we have proposed with NAAC through an INRA-NARO 2019 bilateral call, to build a “Plant Automatic Assembly Pipeline” (PAAP) aiming at providing a preliminary sequence assembly of long reads (PacBio sequel) and optical map (Bionano Saphyr) data (alternatively including 10x and Hi-C data when available). The ultimate goal would be to link PAAP with the TriAnnot structural and functional automatic annotation pipeline (Leroy et al. (2012) Frontiers in Plant Sciences 3:1-14) developed few years ago with NAAC (NIAS at this time). All these data, tools and projects will be valorized to study an important ~2 Mb region (5BSFR) of the wheat chromosome 5BS carrying a gene (Skr) responsible of cross incompatibility between wheat and rye, and other genes controlling important wheat traits. A precise manual curated analysis will be carried out across all genomes 5BSFR available in term of genes, Transposable Elements (TEs) and ncRNA in collaboration with several INRA and international research teams. We will present the new GDEC research scheme, and described the ongoing results obtained so far within the wheatOMICS project with a focus on the Skr project lead by Pierre Sourdille at INRA GDEC. Highlight will be also presented within our new bioinformatics team lead by Frederic Choulet.
 
 
 
==== Pas de séminaire le 24 janvier (v&oelig;ux de la présidence du centre) ====
 
 
 
==== 17/01/2020&nbsp;: '''Exceptionnellement à 11h''' ''Enhancing robots autonomy through sequential decision making : from robust perception and mission planning to mixed-initiative human-robot(s) interaction''. [https://personnel.isae-supaero.fr/caroline-chanel/?lang=fr Caroline Chanel] (ISAE, DCAS) ====
 
 
 
:
 
::'''Résumé&nbsp;:''' Missions involving humans interacting with automated systems become increasingly common. On one hand, the use of automated planning for artificial agents actions has been amplified by the recent technical advances in artificial intelligence and machine learning, encouraging human supervision of such automated systems. It may includes efficient perception or path planning for autonomous vehicles in cluttered environments under uncertainty. On another hand, due to the non-deterministic behavior of the human and possibly high risk of failing due to human factors, such an integrated system should react smartly by adapting its behavior when necessary. Due to the increase of the decision autonomy of artificial agents, the role of the human operator is reduced regarding direct control, and concentrated on higher level decisions, that are not automated for practical, ethical or legal reasons. However, human operators are still vital in numerous scenarios because they are able to produce tactical, moral, social and ethical decisions. This drastic change of the human operator role, in favor of system’s autonomy, results in a new paradigm also known as mixed-initiative. Mixed-initiative human-robot interaction considers human operators and artificial agents as a team, in which each agent can seize the initiative from the other. From the human operator’s point of view it is not always bearable or acceptable that such an artificial system could seize the initiative, except if human cognitive capabilities or human performance are degraded. In this context, this talk will present our current research on those topics, ranging from perception and mission planning scenarios, in-situ and online human-robot interaction experiments, and methods to predict human operators decisions and performance, methods to learn the interaction model of a mixed-initiative human-robot(s) mission, to finally treat mixed-initiative AI methods to drive human-robot(s) interactions.
 
 
 
==== 10/01/2020&nbsp;: ''Méthodes régularisées pour l’analyse de données multivariées en grande dimension: théorie et applications''. [https://www6.inra.fr/mia-paris/Equipes/Membres/Marie-Perrot-Dockes Marie Perrot-Dockes] (MIA Paris) ====
 
 
 
:
 
::'''Résumé&nbsp;:''' Dans cette présentations nous nous intéressons au modèle linéaire général (modèle linéaire multivarié) en grande dimension. Nous proposons un nouvel estimateur parcimonieux des coefficients de ce modèle qui prend en compte la dépendance qui peut exister entre les différentes réponses. Cet estimateur est obtenu en estimant dans un premier temps la matrice de covariance des réponses puis en incluant cette matrice de covariance dans un critère Lasso. Les propriétés théoriques de cet estimateur sont étudiées lorsque le nombre de réponses peut tendre vers l’infini plus vite que la taille de l’échantillon. Plus précisément, nous proposons des conditions générales que doivent satisfaire les estimateurs de la matrice de covariance et de son inverse pour obtenir la consistance en signe des coefficients. Nous avons ensuite mis en place des méthodes, adaptées à la grande dimension, pour l’estimation de matrices de covariance qui sont supposées être des matrices de Toeplitz ou des matrices avec une structure par blocs, pas nécessairement diagonaux. Ces différentes méthodes ont enfin été appliquées à des problématiques de métabolomique, de protéomique et d’immunologie.
 
 
 
==== Pas de séminaire le 27 décembre et le 3 janvier (vacances scolaires) ====
 
 
 
==== Pas de séminaire le 20 décembre&nbsp;: Soutenance de thèse de Léonard Torossian à l'IMT le mardi 17 décembre à 13h30 ====
 
 
 
==== 13/12/2019 &nbsp;: ''T'ouIST: a friendly language for propositional logic and more, application to planning with SAT or QBF solvers''.&nbsp;[https://www.irit.fr/~Frederic.Maris/ Frédéric Maris] (UMR IRIT, Université Toulouse III) ====
 
  
:
+
==== 04/12/2020&nbsp;: ''Journée des doctorants du pôle IMABS'' ====
::'''Résumé&nbsp;: ''' we present the automatic translator TouIST that allows us to use a simple language to generate logical formulas from a problem description. Our tool allows us to model many static or dynamic combinatorial problems as Sudoku, Takuzu or Nim game, and to benefit from the regular improvements to SAT, QBF or SMT solvers to solve them efficiently. We present reference encodings to solve classical planning problems with SAT and QBF solvers and show how to use TouIST to solve such planning problems. Finally, we may show how to encode with TouIST some combinatorial problems given by the audience.
 
  
==== Pas de séminaire le 6 décembre&nbsp;: [https://www6.inra.fr/imabs/Evenements/Seminaires/Chromosome-conformation-symposium Chromosome Conformation Symposium] (4-5 décembre) et [https://carlit.toulouse.inra.fr/AIGM/ Journée AIGM] (5 décembre) ====
+
==== 27/11/2020&nbsp;: ''Simulation en recherche médicale. Généralités, exemple et problème connexe.'' [https://perso.math.univ-toulouse.fr/savy/ Nicolas Savy] (IMT) ====
  
==== 29/11/2019 &nbsp;: ''Contributions to probabilistic non-negative matrix factorization - Maximum marginal likelihood estimation and Markovian temporal models''. [https://lfilstro.github.io/ Louis Filstroff] (UMR IRIT) [https://mia.toulouse.inra.fr/images/c/c3/Louis_filstroff.pdf diaporama] ====
+
:'''Résumé&nbsp;:''' Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.
  
:
+
==== 13/11/2020&nbsp;: ''Conception et mise en œuvre d’un système modulaire de mini-bioréacteurs pour la culture continue de microorganismes''. Cyprien Guérin (Inrae, MaIAGE) ====
::'''Résumé&nbsp;: ''' Non-negative matrix factorization (NMF) has become a popular dimensionality reduction technique, and has found applications in many different fields, such as audio signal processing, hyperspectral imaging, or recommender systems. In its simplest form, NMF aims at finding an approximation of a non-negative data matrix (i.e., with non-negative entries) as the product of two non-negative matrices, called the factors. One of these two matrices can be interpreted as a dictionary of characteristic patterns of the data, and the other one as activation coefficients of these patterns. This low-rank approximation is traditionally retrieved by optimizing a measure of fit between the data matrix and its approximation. As it turns out, for many choices of measures of fit, the problem can be shown to be equivalent to the joint maximum likelihood estimation of the factors under a certain statistical model describing the data. This leads us to an alternative paradigm for NMF, where the learning task revolves around probabilistic models whose observation density is parametrized by the product of non-negative factors. This general framework, coined probabilistic NMF, encompasses many well-known latent variable models of the literature, such as models for count data. 
 
  
:
+
:'''Résumé'''&nbsp;: Les systèmes de culture continue en bioréacteurs restent, malgré leur intérêt, peu utilisés dans les laboratoires de microbiologie. L’objectif de ce projet de thèse est de faciliter leur mise en œuvre en proposant un nouveau système modulaire de mini-bioréacteurs pilotés par ordinateur en s’appuyant sur les opportunités offertes par l’essor des technologies de fabrication numérique et des microcontrôleurs programmables. Les volumes de culture visés sont de l’ordre de 5 à 10 mL afin de permettre des plans d’expériences complexes pouvant impliquer de nombreux bioréacteurs (en parallèle, en cascade, avec suivi et contrôle en temps réel, ...). Comme preuves de concept, plusieurs applications chez la bactérie Gram-positive ''Bacillus subtilis'' sont envisagées aussi bien dans des contextes d’évolution expérimentale et dirigée que pour des études physiologiques s’appuyant sur de la comparaison de transcriptomes.
::In this talk, we consider specific probabilistic NMF models in which a prior distribution is assumed on the activation coefficients, but the dictionary remains a deterministic variable. The objective is then to maximize the marginal likelihood in these semi-Bayesian NMF models, i.e., the integrated joint likelihood over the activation coefficients. This amounts to learning the dictionary only; the activation coefficients may be inferred in a second step if necessary. We proceed to study in greater depth the properties of this estimation process. In particular, two scenarios are considered. In the first one, we assume the independence of the activation coefficients sample-wise. Previous experimental work showed that dictionaries learned with this approach exhibited a tendency to automatically regularize the number of components, a favorable property which was left unexplained. In the second one, we lift this standard assumption, and consider instead Markov structures to add statistical correlation to the model, in order to better analyze temporal data.  
 
  
==== 22/11/2019 &nbsp;: ''Critical points of Gaussian isotropic random fields''. Céline Delmas (GenPhySE, MIAT) ====
+
==== 06/11/2020&nbsp;: ''Titre à venir''. Etienne Delay (CIRAD, GREEN) ====
  
:
+
==== 23-30/10/2020&nbsp;: Pas de séminaire (vacances scolaires) ====
::'''Résumé&nbsp;:''' Let '''''X''''' = {''X''(''t'')&nbsp;: ''t'' in ''R''<sup>''N''</sup>} be an isotropic Gaussian random field with real values. In a first part we study the mean number of critical points of ''X'' with index ''k'', above a level, using random matrices tools. We obtain an exact expression for the probability density of the eigenvalue of rank ''k'' of a ''N''-GOE matrix. We deduce exact expressions for the mean number of critical points with a given index and their distribution as a function of their index. In a second part we study attraction or repulsion between these critical points again as a function of their index. A measure is the correlation function. We prove attraction between critical points when ''N''>2, neutrality for ''N''=2 and repulsion for ''N''=1. We prove that the attraction between critical points that occurs when the dimension is greater than 2 is due to attraction between critical points with adjacent indexes. We prove a strong repulsion between maxima and minima and we study the correlation function between maxima (or minima). 
 
  
==== 15/11/2019&nbsp;: ''How to Lie With Graphics''. [https://www.tse-fr.eu/fr/people/christophe-bontemps Christophe Bontemps] (GREMAQ) ([http://data.visualisation.free.fr/Blog/HowToLie-Short.pdf diaporama], [http://data.visualisation.free.fr/ site Web]) ====
+
==== 16/10/2020&nbsp;: ''Estimation of species environmental niches and sampling effort from presence only records and illustration on the Pl@ntNet citizen-science flora data''. [http://christophebotella.fr/ Christophe Botella] (LECA) ====
  
:
+
:'''Résumé''': Naturalist mobile applications have been deployed worldwide in the last years and enabled access to a considerable amount of geolocated species presences records. This novel type of data represents a step forward to address ecological and conservation questions through the use of species distribution models (SDMs). However, in the absence of a sampling protocol, the sampling effort often concentrates on specific locations (cities, riverside walks, etc.) located in specific environments, resulting in estimation biases in SDMs. During my PhD, I studied methods to minimize bias in the estimation of inhomogeneous Poisson point processes (IPP) modelling species habitats preferences. I will present two approaches: (i) pooling occurrences from many species, using them as background points in the IPP and conditions under which it yields unbiased estimates, and (ii) the joint modeling of multiple species densities along with a common sampling effort component. Finally, I will show an illustration on Pl@ntNet's citizen science data over the whole French territory, integrating several hundred plant species and hundreds of thousands of observations over France with a highly biased sampling.
::'''Résumé&nbsp;:''' We use and read data visualizations (dataviz) in our everyday lives as researchers, engineers, and citizens. Most of the time, our goal is to visually test some basic hypotheses either while exploring datasets or for presenting some findings. These dataviz also serve to convince people and ourselves that some hypotheses are valid. But what if these convincing graphics were lies? Many graphics convey information that could be misleading, by mistake, misuse or on purpose. I propose a short tutorial to visual fallacies and lies. My goal here is not to encourage cheating and lying, but on the contrary to highlight the techniques used to elaborate misleading data visualizations. This introduction should help researchers, and decision makers to distinguish visual lies from unambiguous and consistent graphics.  
 
  
==== 8/11/2019&nbsp;: ''Modélisation multi-agent et intégration culture-élevage dans les territoires''. Myriam Grillot (INRA, AGIR) ====
+
==== 09/10/2020&nbsp;: ''Model Exploration in Practice''. [https://iscpif.fr/projects/romain-reuillon/ Romain Reuillon] (CNRS, ISC-PIF) ====
  
:
+
:'''Résumé'''&nbsp;: The use of simulation models has widely spread in recent years, in various fields of academic research. Models are being developed to represent and try to better understand all kinds of systems: population dynamics, epidemics, transportation systems, macro-scale systems, micro-scale systems, etc. In some scientific areas, models and in silico simulations have become essential to help study in vivo situations.
::'''Résumé&nbsp;:''' Les interactions entre cultures et élevage peuvent être modélisées par l'intermédiaire de modèle multi-agents. Dans un contexte agro-sylvo-pastoral au Sénégal, un modèle de ce type a été développé et implémenté (plateforme de modélisation GAMA) pour répondre à des questions relatives aux impacts des changements dans l’organisation du paysage et des systèmes d’élevage sur les flux de biomasse et d’azote. Différents niveaux d’organisation du territoire son pris en compte&nbsp;: la parcelle, le troupeau, le ménage et le terroir villageois. Quelles réflexions pour des utilisations de tels modèles et sur le travail sur l'interaction culture-élevage dans les territoires en France&nbsp;? 
+
: However, simulation models are necessarily a simplification of reality, and hypotheses have to be made when developing a model. Thus every model can (and needs to?) be questioned: Is it relevant to tackle the research question behind it? How to extract significant knowledge from the model? What kind of dynamics can it exhibit? How does each mechanism of the model impact those dynamics? Is every mechanism really necessary? These are just some of the many questions a model developer has to answer in order to really know and understand his/her model!
 +
:This talk focuses on the worldwide zombie epidemic of the past few years. It raises the question of what can modelers say about it, and, it attempts to use model exploration, OpenMOLE (openmole.org) and the associated exploration methodology to build knowledge on this forefront phenomenon.
  
==== Pas de séminaire le 25 octobre et le 1er novembre (vacances scolaires) ====
+
==== 02/10/2020&nbsp;: ''Méthodes mathématiques en écologie''. [https://www.ummisco.fr/?page_id=1150 Tri Nguyen-Huu] (IRD)  ([https://miat.inrae.fr/site/images/7/7e/Pr%C3%A9sentation_MIAT_%28light%29.pdf diaporama]) ====
  
==== 18/10/2019&nbsp;: ''Distribution "Dirichlet-Multinomiale" et modèles neutres: une hypothèse nulle pour l'analyse de données de biodiversité''. [https://sites.google.com/site/fabienlarochescience/ Fabien Laroche] (Unité EFNO, IRSTEA) ====
+
:'''Résumé'''&nbsp;:   Le développement de modèles mathématiques ont permis d'apporter un point de vue neuf sur des questions écologiques d'ordre général ou bien appliquées. Des modèles abstraits permettent de mieux comprendre les processus régissant certains écosystèmes, tandis que des modèles plus descriptifs permettent d'avoir une vision plus quantitative des phénomènes étudiés. Nous présenterons quelques modèles mathématiques issus des systèmes dynamiques (équations différentielles, équations aux différences finies) et nous intéresserons à ce qu'ils peuvent apporter à l'étude de quelques problèmes écologiques, à savoir la dynamique bio-économique des pêcheries, la connectivité d'espèces marines récifales, et la conservation des grands herbivores dans les parcs nationaux du Kenya.
  
:
+
==== 25/09/2020&nbsp;: ''Learning with pangenomes''. [https://lbbe.univ-lyon1.fr/-Jacob-Laurent-.html?lang=fr Laurent Jacob] (CNRS, LBBE) ====
::'''Résumé&nbsp;:''' L'écologie des communautés vise à comprendre comment les conditions environnementales et les interactions entre organismes génèrent la diversité des espèces, phénotypes et génotypes que l'on observe dans les écosystèmes. Sur des systèmes naturels ou semi-naturels en conditions non-contrôlées, une approche possible consiste en la mise en œuvre de tests statistiques sur des échantillonnages spatiaux d'individus, afin de détecter une contribution significative de processus écologiques ciblés, facteurs environnementaux ou interactions. Dans cet exposé, je propose d'illustrer comment la théorie neutre de la biodiversité - qui suppose une équivalence écologique des espèces - peut fournir un cadre de test général et une hypothèse nulle, la distribution Dirichlet-Multinomiale, à même de compléter voire corriger les méthodes plus classiques à base de permutation de données ou de rééchantillonnage. 
 
  
==== 11/10/2019&nbsp;: ''Copules et tests non-paramétriques de détection de rupture dans la dépendance entre les composantes d'observations multivariées''. [http://www.cmap.polytechnique.fr/~tom.rohmer/ Tom Rohmer] (GenPhySE) ====
+
:'''Résumé'''&nbsp;: As the number and variety of sequenced genomes grows, representing them by comparison to a single reference leads to an increasing level of approximation, discarding accessory genes, rearrangements and repeated regions. This problem is particularly acute when studying microbial genomes or metagenomes, and hinders essential statistical tasks such as GWAS or prediction in this context. I will discuss genome representations which are well suited to statistical analysis when genomes are ill-suited to alignment or even assembly.
  
:
+
==== 18/09/2020&nbsp;: ''Partager de l'information pour faire face à un virus. Etude de cas en ostréiculture via un modèle multi-agent.'' Nicolas Paget (CIRAD) ====
::'''Résumé&nbsp;:''' L'étude des copules est un phénomène relativement récent et en plein essor. Ces dernières permettent notamment de caractériser la dépendance entre les différentes composantes de données multivariées. Elles sont ainsi utilisées dans de nombreuses applications, que ce soit en hydrologie, finance ou encore en génétique. Si l'on considère un vecteur aléatoire (v.a.) dont les marges sont continues, le théorème de Sklar affirme qu'il existe une unique fonction "copule", caractérisant la structure de dépendance du v.a., telle que la donnée de la copule et des fonctions de répartitions marginales caractérisent la loi du vecteur aléatoire. Dans la littérature, on retrouvera un certain nombre de tests non-paramétriques de détection de rupture dans la distribution d'observations multivariées. Cependant, ces tests se révèlent souvent très peu sensibles pour détecter un changement dans la dépendance entre les composantes des v.a. Je présenterai dans cet exposé un test non paramétrique basé sur le processus de copule empirique séquentiel (approche CUSUM) et sur un rééchantillonage à base de multiplicateurs. Ce test se révèle particulièrement sensible à un changement dans la copule lorsque les lois marginales sont inchangées, et s'adapte à des données sériellement dépendantes (strong mixing). Ce test ne permet pas de conclure en une rupture dans la copule en présence de changement dans les lois marginales. Il est néanmoins possible d'adapter les procédures pour prendre en compte ces potentiels changements. J'illustrerai ces travaux à l'aide d'exemple sur des données et des simulations de Monte Carlo sur des classes d'alternatives pertinentes. Pour finir je présenterai quelques-unes de mes perspectives de recherche à l'Inra qui pourront s'appuyer sur cette recherche. 
 
  
==== Pas de séminaire le 4 octobre (Journée Bioinfo/biostat) ====
+
:'''Résumé'''&nbsp;: Le postulat selon lequel le partage d'information permet de meilleures prises de décisions est fortement ancré. En développant un modèle multi-agent sur la plateforme Cormas, nous avons questionné ce postulat. Depuis quelques années, les ostréiculteurs font face à un virus (os-hv1) au fort taux de létalité. Ce virus n'est que mal connu. Dans le modèle, les agents, de rationalités variées, partagent leurs expériences et en tirent des leçons pour leurs pratiques. Nous étudions alors le type de décision prise par les agents en fonction de scénarios de partage de l'informations et d'hétérogénéité des agents. Les résultats montrent que l'hétérogénéité des agents permet une meilleure exploration de l'espace des possibles et qu'un partage et une interprétation trop radicaux des expériences de chacun à un effet contreproductif. Ce travail a été effectué en thèse. Lors de cette présentation, j'évoquerai aussi des travaux ou pistes de travaux plus récents ou en cours d'initialisation dans l'idée de susciter des collaborations.
  
==== 27/09/2019&nbsp;: ''Effondrement&nbsp;: et si on en parlait vraiment&nbsp;? Quelles perspectives pour nos recherche&nbsp;?'' [https://www.dynafor.fr/deconchat-marc Marc Deconchat] (Dynafor) [https://mia.toulouse.inra.fr/images/5/56/M_Deconchat.pdf diaporama] [https://mia.toulouse.inra.fr/images/3/35/M_Deconchat_supp.jpg image supplémentaire] ====
+
==== 11/09/2020&nbsp;: ''Thigmoimmunité végétale. Comment la mécanoperception participe à la réponse immunitaire''. Adelin Barbacci (LIPM) ====
  
:
+
:'''Résumé'''&nbsp;: Les attaques de parasites sont responsables chaque année de pertes de récolte considérables à travers le monde. La recherche de sources génétiques de résistance durable chez les plantes constitue un levier important pour répondre à la demande alimentaire mondiale. ''Sclerotinia sclerotiorum'' est le champignon pathogène responsable de la maladie de la pourriture blanche sur plus de 400 espèces végétales, causant plusieurs millions d’euros de pertes de récolte chaque année, notamment sur colza. Comme la majorité des agents pathogènes, ''S. sclerotiorum'' utilise la sécrétion de molécules effectrices pour manipuler la physiologie des plantes hôtes et favoriser son développement. La mise en place de la QDR est consécutive à la perception du champignon. Toutefois, contrairement à la résistance gène-pour-gène plus largement étudiée, la QDR mobilise de nombreux réseaux de gènes qui sont encore méconnus et ne sont pas tous spécifiquement dédiés à l’immunité. Or, l'interaction plante-champignon met en jeu des signaux mécaniques importants, intrinsèques à la pénétration des tissus de l’hôte.
::'''Résumé&nbsp;:''' Que l’on parvienne ou non à prendre les mesures requises pour faire face aux changements globaux, cela aboutira quasi inévitablement à des changements si profonds de nos sociétés et modes de vie qu’on peut parler de leur effondrement. Cela concernera bien évidemment et plus particulièrement les activités agricoles et d’usage des ressources naturelles, et cela nous concerne donc dans nos recherches. Pourtant, avons-nous bien pris la mesure de ce que cela signifie&nbsp;? Pour P Servigne et ses co-auteurs ce n’est pas le cas car les implications seraient trop désespérantes et nous refuserions de nous y confronter. Si vous êtes prêts à en discuter, ce séminaire sera l’occasion de partager une vue d’ensemble de la Collapsologie, qui s’intéresse à ce phénomène particulier que serait un effondrement général, sans prétention d’en faire le tour. Les débats, car il y en aura sans doute tant le sujet est polémique, seront orientés vers les questions de recherche que nous posent ces perspectives.  
+
:Au cours de ces deux dernières années nous avons réussi à montrer que les signaux mécaniques jouent un rôle de premier plan dans la mise en place de la réponse immunitaire et qu’il était possible de moduler fortement le niveau de résistance des plantes grâce à des ondes mécaniques. Ce travail est le fruit d’une collaboration étroite entre des équipes de physique (Aroune Duclos Laboratoire d’Acoustique de l’Université du Mans), de physiologie végétale (Nathalie Leblanc-Fournier INRA PIAF Clermont, Tou-Cheu Xiong INRA BPMP Montpellier) de biologie moléculaire (Adelin Barbacci LIPM) et de modélisation mathématique et informatique (Frédérick Garcia MIAT). C’est également le point de départ de la thèse de Khaoula Hadj-Amor coencadrée par MIAT et le LIPM. L’exposé s’attachera à présenter nos aventures entre mécanoperception, proprioception et réponse immunitaire.
  
:
+
== Séminaires reportés à une date ultérieure ==
::''Autres références'': [http://www.labos1point5.org http://www.labos1point5.org] et [https://pabloservigne.com/ https://pabloservigne.com/] 
 
  
==== 20/09/2019&nbsp;: ''Component-wise approximate Bayesian computation via Gibbs-like steps''. [https://www.ceremade.dauphine.fr/~stoehr/ Julien Stoehr] (CEREMADE) ====
+
==== ''Optimal convergence rates for Nesterov acceleration.'' [https://perso.math.univ-toulouse.fr/rondepierre/ Aude Rondepierre] (INSA/IMT) ====
  
:
+
:'''Résumé&nbsp;:''' In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
::'''Résumé&nbsp;:''' Approximate Bayesian computation methods are useful for generative models with intractable likelihoods. These methods are however sensitive to the dimension of the parameter space, requiring exponentially increasing resources as this dimension grows. To tackle this difficulty, we&nbsp;explore a Gibbs version of the ABC approach that runs component-wise approximate Bayesian computation steps aimed at the corresponding conditional posterior distributions, and based on summary statistics of reduced dimensions. While lacking the standard justifications for the Gibbs&nbsp;sampler, the resulting Markov chain is shown to converge in distribution under some partial independence conditions. The associated stationary distribution can further be shown to be close to the true posterior distribution and some hierarchical versions of the proposed mechanism enjoy a&nbsp;closed form limiting distribution. Experiments also demonstrate the gain in efficiency brought by the Gibbs version over the standard solution.  
+
:This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.
  
:
 
::Référence&nbsp;: [[Arxiv.org/abs/1905.13599|arxiv.org/abs/1905.13599]] 
 
  
==== 13/09/2019&nbsp;: ''Impact of tree choice in metagenomics differential abundance studies''. [http://www.math-evry.cnrs.fr/members/abichat/welcome Antoine Bichat] (LaMME - Enterome) ====
+
==== ''KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows''. [https://imag.umontpellier.fr/~charlier/ Benjamin Charlier] (Université de Montpellier, ARAMIS)====
  
:
+
:'''Résumé&nbsp;:''' The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula.  It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
::'''Résumé&nbsp;:''' We consider the problem of incorporating evolutionary information (e.g. taxonomic or phylogenic trees) in the context of metagenomics differential analysis. Recent results published in the literature propose different ways to leverage the tree structure to increase the detection rate of differentially abundant taxa. Here, we propose instead to use a different hierachical structure, in the form of a correlation-based tree, as it may capture the structure of the data better than the phylogeny. We first show that the correlation tree and the phylogeny are significantly different before turning to the impact of tree choice on detection rates. Using synthetic data, we show that the tree does have an impact: smoothing p-values according to the phylogeny leads to equal or inferior rates as smoothing according to the correlation tree. However, both trees are outperformed by the classical, non hierachical, Benjamini-Hochberg (BH) procedure in terms of detection rates. Other procedures may use the hierachical structure with profit but do not control the False Discovery Rate (FDR) a priori and remain inferior to a classical Benjamini-Hochberg procedure with the same nominal FDR. On real datasets, no hierarchical procedure had significantly higher detection rate that BH. Although intuition advocates the use of a hierachical structure, be it the phylogeny or the correlation tree, to increase the detection rate in microbiome studies, current hierachical procedures are still inferior to non hierachical ones and effective procedures remain to be invented.
+
:KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU. KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
 +
:Web site: http://www.kernel-operations.io
  
 
== Séminaires passés / Past seminars ==
 
== Séminaires passés / Past seminars ==

Version du 14 octobre 2020 à 08:16

Sommaire

Séminaires de l'unité MIAT

Pyrenees-morning.jpg

Le séminaire de l'équipe MIAT de l'INRA de Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.

Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT de l'INRA Auzeville/Castanet est indiqué ici (nous sommes à moins de 30 mètres de la réception !).


Séminaires de l'année en cours et séminaires futurs

15/01/2021 : Titre à venir. Évelyne Lutton (MIA/ISC-PIF)

04/12/2020 : Journée des doctorants du pôle IMABS

27/11/2020 : Simulation en recherche médicale. Généralités, exemple et problème connexe. Nicolas Savy (IMT)

Résumé : Un des axes du projet Big Data financé par la Région Occitanie et porté par l’Institut de Mathématiques de Toulouse était une réflexion générale sur la notion de simulation en recherche médicale et sur la pertinence de méthodes de simulation dans ce contexte. Une présentation des fruits de cette réflexion qui soyons honnête à fait émerger plus de problèmes que de solutions, sera présenté dans un première partie. Dans une deuxième partie sera présenté un exemple de modèle à agents développé dans le contexte médico-économique du passage aux génériques des anti retro-viraux. Enfin un des points saillants pour la mise au place de méthodes par simulation en recherche médicale est la calibration des modèles sous-jacents. Si des bases existent elles sont souvent difficiles à exploiter dans un contexte dédié pour des questions d’homogénéité des codages. C’est une question très vaste pour laquelle nous avons développé un début de solution par l’algorithme “OT”. Il s’agit d’un algorithme de recodage de variables basé sur le transport optimal qui sera présenté en troisième partie de cet exposé.

13/11/2020 : Conception et mise en œuvre d’un système modulaire de mini-bioréacteurs pour la culture continue de microorganismes. Cyprien Guérin (Inrae, MaIAGE)

Résumé : Les systèmes de culture continue en bioréacteurs restent, malgré leur intérêt, peu utilisés dans les laboratoires de microbiologie. L’objectif de ce projet de thèse est de faciliter leur mise en œuvre en proposant un nouveau système modulaire de mini-bioréacteurs pilotés par ordinateur en s’appuyant sur les opportunités offertes par l’essor des technologies de fabrication numérique et des microcontrôleurs programmables. Les volumes de culture visés sont de l’ordre de 5 à 10 mL afin de permettre des plans d’expériences complexes pouvant impliquer de nombreux bioréacteurs (en parallèle, en cascade, avec suivi et contrôle en temps réel, ...). Comme preuves de concept, plusieurs applications chez la bactérie Gram-positive Bacillus subtilis sont envisagées aussi bien dans des contextes d’évolution expérimentale et dirigée que pour des études physiologiques s’appuyant sur de la comparaison de transcriptomes.

06/11/2020 : Titre à venir. Etienne Delay (CIRAD, GREEN)

23-30/10/2020 : Pas de séminaire (vacances scolaires)

16/10/2020 : Estimation of species environmental niches and sampling effort from presence only records and illustration on the Pl@ntNet citizen-science flora data. Christophe Botella (LECA)

Résumé: Naturalist mobile applications have been deployed worldwide in the last years and enabled access to a considerable amount of geolocated species presences records. This novel type of data represents a step forward to address ecological and conservation questions through the use of species distribution models (SDMs). However, in the absence of a sampling protocol, the sampling effort often concentrates on specific locations (cities, riverside walks, etc.) located in specific environments, resulting in estimation biases in SDMs. During my PhD, I studied methods to minimize bias in the estimation of inhomogeneous Poisson point processes (IPP) modelling species habitats preferences. I will present two approaches: (i) pooling occurrences from many species, using them as background points in the IPP and conditions under which it yields unbiased estimates, and (ii) the joint modeling of multiple species densities along with a common sampling effort component. Finally, I will show an illustration on Pl@ntNet's citizen science data over the whole French territory, integrating several hundred plant species and hundreds of thousands of observations over France with a highly biased sampling.

09/10/2020 : Model Exploration in Practice. Romain Reuillon (CNRS, ISC-PIF)

Résumé : The use of simulation models has widely spread in recent years, in various fields of academic research. Models are being developed to represent and try to better understand all kinds of systems: population dynamics, epidemics, transportation systems, macro-scale systems, micro-scale systems, etc. In some scientific areas, models and in silico simulations have become essential to help study in vivo situations.
However, simulation models are necessarily a simplification of reality, and hypotheses have to be made when developing a model. Thus every model can (and needs to?) be questioned: Is it relevant to tackle the research question behind it? How to extract significant knowledge from the model? What kind of dynamics can it exhibit? How does each mechanism of the model impact those dynamics? Is every mechanism really necessary? These are just some of the many questions a model developer has to answer in order to really know and understand his/her model!
This talk focuses on the worldwide zombie epidemic of the past few years. It raises the question of what can modelers say about it, and, it attempts to use model exploration, OpenMOLE (openmole.org) and the associated exploration methodology to build knowledge on this forefront phenomenon.

02/10/2020 : Méthodes mathématiques en écologie. Tri Nguyen-Huu (IRD) (diaporama)

Résumé : Le développement de modèles mathématiques ont permis d'apporter un point de vue neuf sur des questions écologiques d'ordre général ou bien appliquées. Des modèles abstraits permettent de mieux comprendre les processus régissant certains écosystèmes, tandis que des modèles plus descriptifs permettent d'avoir une vision plus quantitative des phénomènes étudiés. Nous présenterons quelques modèles mathématiques issus des systèmes dynamiques (équations différentielles, équations aux différences finies) et nous intéresserons à ce qu'ils peuvent apporter à l'étude de quelques problèmes écologiques, à savoir la dynamique bio-économique des pêcheries, la connectivité d'espèces marines récifales, et la conservation des grands herbivores dans les parcs nationaux du Kenya.

25/09/2020 : Learning with pangenomes. Laurent Jacob (CNRS, LBBE)

Résumé : As the number and variety of sequenced genomes grows, representing them by comparison to a single reference leads to an increasing level of approximation, discarding accessory genes, rearrangements and repeated regions. This problem is particularly acute when studying microbial genomes or metagenomes, and hinders essential statistical tasks such as GWAS or prediction in this context. I will discuss genome representations which are well suited to statistical analysis when genomes are ill-suited to alignment or even assembly.

18/09/2020 : Partager de l'information pour faire face à un virus. Etude de cas en ostréiculture via un modèle multi-agent. Nicolas Paget (CIRAD)

Résumé : Le postulat selon lequel le partage d'information permet de meilleures prises de décisions est fortement ancré. En développant un modèle multi-agent sur la plateforme Cormas, nous avons questionné ce postulat. Depuis quelques années, les ostréiculteurs font face à un virus (os-hv1) au fort taux de létalité. Ce virus n'est que mal connu. Dans le modèle, les agents, de rationalités variées, partagent leurs expériences et en tirent des leçons pour leurs pratiques. Nous étudions alors le type de décision prise par les agents en fonction de scénarios de partage de l'informations et d'hétérogénéité des agents. Les résultats montrent que l'hétérogénéité des agents permet une meilleure exploration de l'espace des possibles et qu'un partage et une interprétation trop radicaux des expériences de chacun à un effet contreproductif. Ce travail a été effectué en thèse. Lors de cette présentation, j'évoquerai aussi des travaux ou pistes de travaux plus récents ou en cours d'initialisation dans l'idée de susciter des collaborations.

11/09/2020 : Thigmoimmunité végétale. Comment la mécanoperception participe à la réponse immunitaire. Adelin Barbacci (LIPM)

Résumé : Les attaques de parasites sont responsables chaque année de pertes de récolte considérables à travers le monde. La recherche de sources génétiques de résistance durable chez les plantes constitue un levier important pour répondre à la demande alimentaire mondiale. Sclerotinia sclerotiorum est le champignon pathogène responsable de la maladie de la pourriture blanche sur plus de 400 espèces végétales, causant plusieurs millions d’euros de pertes de récolte chaque année, notamment sur colza. Comme la majorité des agents pathogènes, S. sclerotiorum utilise la sécrétion de molécules effectrices pour manipuler la physiologie des plantes hôtes et favoriser son développement. La mise en place de la QDR est consécutive à la perception du champignon. Toutefois, contrairement à la résistance gène-pour-gène plus largement étudiée, la QDR mobilise de nombreux réseaux de gènes qui sont encore méconnus et ne sont pas tous spécifiquement dédiés à l’immunité. Or, l'interaction plante-champignon met en jeu des signaux mécaniques importants, intrinsèques à la pénétration des tissus de l’hôte.
Au cours de ces deux dernières années nous avons réussi à montrer que les signaux mécaniques jouent un rôle de premier plan dans la mise en place de la réponse immunitaire et qu’il était possible de moduler fortement le niveau de résistance des plantes grâce à des ondes mécaniques. Ce travail est le fruit d’une collaboration étroite entre des équipes de physique (Aroune Duclos Laboratoire d’Acoustique de l’Université du Mans), de physiologie végétale (Nathalie Leblanc-Fournier INRA PIAF Clermont, Tou-Cheu Xiong INRA BPMP Montpellier) de biologie moléculaire (Adelin Barbacci LIPM) et de modélisation mathématique et informatique (Frédérick Garcia MIAT). C’est également le point de départ de la thèse de Khaoula Hadj-Amor coencadrée par MIAT et le LIPM. L’exposé s’attachera à présenter nos aventures entre mécanoperception, proprioception et réponse immunitaire.

Séminaires reportés à une date ultérieure

Optimal convergence rates for Nesterov acceleration. Aude Rondepierre (INSA/IMT)

Résumé : In this talk, we will give new optimal decay rates for the Nesterov acceleration scheme of classical gradient descent depending on the local geometry of the function to minimize. Only bounds on the rates are known for convex or strongly convex functions. We will give a more complete description of this rates using Lojasievicz and flatness conditions and explain how these decays can be obtained studying an ODE.
This is a joint work with V. Apidopoulos, J.-F. Aujol and Ch. Dossal.


KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows. Benjamin Charlier (Université de Montpellier, ARAMIS)

Résumé : The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula. It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU. KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
Web site: http://www.kernel-operations.io

Séminaires passés / Past seminars

Lien vers la Liste des séminaires passés de l'unité MIAT.

Contacts

Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter Patrick Taillandier ou Matthias Zytnicki.

Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels