Séminaires

De MIAT INRA
Aller à : navigation, rechercher

Sommaire

Séminaires de l'unité MIAT

Pyrenees-morning.jpg

Le séminaire de l'équipe MIAT d'INRAe Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.

Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT d'INRAe Auzeville/Castanet est indiqué ici.

Séminaires de l'année en cours et séminaires futurs

29/09/2023 : Créneau disponible

22/09/2023 : Créneau disponible

15/09/2023 : Créneau disponible

08/09/2023 : Titre à venir, Jean Monlong (Inserm, Purpan)

Vacances d'été

30/06/2023 : Titre à venir, Lorenzo Sala (MaIAGE, INRAE, Jouy-en-Josas)

23/06/2023 : Matinée de séminaire des stagiaires

16/06/2023 : Robust Quasi Monte Carlo, David Métivier (MISTEA, INRAE Montpellier) [distanciel]

Résumé : Given a simulation budget of N points to calculate an expectation/integral, and some confidence level, what is the optimal confidence interval one can build? For which estimator? The classic Monte Carlo method builds intervals of size proportional to the inverse squared root of N and of the confidence level. Can we do better? The answer is yes. However, “standard” variance reduction techniques such as Quasi Monte Carlo are not fully efficient for this task. In this talk, we show that a judicious choice of “robust” aggregation methods coupled with Quasi Monte Carlo techniques allows reaching the optimal error bound. I will review Quasi Monte Carlo methods, different concentration inequalities and robust mean estimators (old and new) to get to the solution, with supporting numerical experiments. I will end by showing how this research makes sense at INRAE 🐑🐑🐑 This is a joint work with M. Lerasle and E. Gobet.

09/06/2023 : Towards explainable land cover mapping: a counterfactual-based strategy, Cassio Fraga-Dantas (Tetis, INRAE, Montpellier) [distanciel]

Résumé : Enhancing the interpretability of AI techniques is paramount for increasing their acceptability, especially in highly interdisciplinary fields such as remote sensing, in which scientists and practitioners with diverse backgrounds work together to monitor the Earth’s surface. In this context, counterfactual explanations are an emerging tool to characterize the behaviour of machine learning systems, by providing a post-hoc analysis of a given classification model. Focusing on the important task of land cover classification from remote sensing data, we propose a counterfactual explanation approach called CFE4SITS (CounterFac- tual Explanation for Satellite Image Time Series). One of its distinctive features over existing strategies is the lack of prior assumption on the targeted class for a given counterfactual explanation. This inherent flexibility allows for the automatic discovery of relationships between classes.

02/06/2023 : Pas de séminaire

26/05/2023 : Apprentissage par Renforcement et Auto-Organisation, Alain Dutech (Université de Nancy)

Résumé : L'apprentissage par renforcement occupe une part de plus en plus grande dans la société mais aussi dans les recherches en IA ou Apprentissage Automatique. Actuellement l'accent est mis sur les techniques d'apprentissage "profond", présenté comme une solution à toutes les difficultés. Au sein de l'équipe BISCUIT du Loria, nous avons une approche différente, voire opposée. Nous nous intéressons aux apprentissages non-supervisés ou auto-organisés. Et dans ce contexte, ce séminaire va revenir sur des travaux exploratoires qui allient cartes auto-organisatrices de Kohonen et apprentissage par renforcement, dans le cadre de problèmes où l'espace d'état est continu. Et la question de recherche, à long terme, est de savoir comment il pourrait être possible de «guider» l'auto-organisation.

19/05/2023 : Pas de séminaire (pont de l'ascension)

12/05/2023 : Problèmes méthodologiques liés à la méta-analyse et à son utilisation pour l’aide à la décision, David Makowski (MIA Paris-Saclay, INRAE) [distanciel]

Résumé : Depuis le milieu des années 90, la méta-analyse a connu un succès croissant. Cette approche statistique consiste à synthétiser un ensemble d’expérimentations - réalisées de manière indépendante dans des conditions variées - pour tester des hypothèses et estimer des paramètres dans le but de répondre à une ou plusieurs questions scientifiques, souvent à forts enjeux sociétaux. Du fait de son lien étroit avec l’expérimentation et de sa relative simplicité, la méta-analyse est dorénavant très souvent utilisée dans différents domaines, par exemples pour tester l’efficacité de traitements médicaux (ex : traitements contre la COVID-19), pour évaluer l’impact environnemental de diverses activités humaines (ex : effet des néonicotinoïdes sur la biodiversité) ou pour comparer différents systèmes agricoles (ex : productivité de systèmes agro-écologiques). La méta-analyse repose sur une démarche bien établie, qui consiste en particulier à constituer un jeu de données à partir de la littérature scientifique puis à ajuster des modèles mixtes incluant un ou plusieurs effets aléatoires décrivant l’hétérogénéité des conditions expérimentales. Néanmoins, la méta-analyse pose un certain nombre de problèmes méthodologiques encore imparfaitement résolus, liés à la récupération des données publiées dans la littérature scientifique, l’analyse d’incertitude, la prise en compte du biais de publication, l’intégration de variables explicatives, ou l’utilisation de la méta-analyse pour réaliser des estimations locales. Dans cet exposé, je présenterai certains de ces problèmes méthodologiques, j’illustrerai leurs conséquences pratiques avec des exemples concrets, et je proposerai des pistes d’amélioration.

28/04/2023 et 05/05/2023  : Pas de séminaire (vacances scolaires)

21/04/2023 : AG interne à l'unité - questions environnementales

14/04/2023 : Séance annulée

07/04/2023 : Computational effector prediction and population genomic analysis of wheat infecting Parastagonospora nodorum, Darcy Jones (séminaire interne, équipe SaAB)

Résumé : Parastagonospora nodorum is a major necrotrophic pathogen of wheat, causing substantial yield and economic loss in Australia (estimated $100M AUD per annum). Robust management of the disease requires an in-depth understanding of both the molecular and evolutionary dynamics involved in infection and pathogen populations. We sequenced and compared the whole genomes of 154 Western Australian P. nodorum isolates to identify the structure and diversity of the population, and to identify genes involved in pathogenicity. We found a single major diverse population, with several small near-clonal clusters restricted to specific times and locations. We observed high levels of mutation and a large accessory pangenome in the population, and identified several candidate proteins involved in virulence. To facilitate the identification of host-specific virulence proteins (effectors), we developed a pipeline for functional characterisation of proteins with an ML ranking model to prioritise candidate proteins. We also conducted a large scale study of fungal protein homology to identify remote homologues of effector proteins and further define structural families. By combining multiple levels of high-throughput experimental analysis and prediction methods, we were able to identify several genes involved in P. nodorum virulence. My project at INRAE will look at the plant host-specific RNA expression patterns observed in the pathogen Sclerotinia sclerotiorum, and what causes those changes in expression. The major project will involve a multi-omics experiment combining RNA-seq with ATAC-seq of S. sclerotiorum on multiple hosts. From this we will identify gene co-expression networks and ATAC-seq features associated with modules, which we will use to dissect the specific mechanisms involved in regulation of host-specific modules. Software will be developed to support this work.

31/03/2023 : Attention-based neural networks for population genetics, Théophile Sanchez (ETH Zurich) [distanciel]

Résumé Artificial neural networks (ANNs) have recently offered new perspectives to solve inference problems from high dimensional data in numerous scientific fields, but it is yet unclear which architectures are the most suited to genomic data. Here, we present a new ANN architecture integrating attention mechanisms to infer effective population size history from genomic data. Built upon our previous exchangeable architecture SPIDNA, MixAttSPIDNA adds attention layers that allow computing more expressive and complex features from combinations of haplotypes. The contribution of each haplotype to the features is learned automatically and depends on its content and affinity with the other haplotypes. Likewise, we use this mechanism to automatically perform a voting scheme that aggregates predictions from different genomic regions. This new architecture outperforms approximate Bayesian computation and SPIDNA on simulations while relying directly on raw genetic data and being invariant to haplotype permutation in the input. As a proof-of-concept, we use this architecture to infer the effective population size history of 54 populations from the HGDP dataset (Bergström et al., 2020), and we compare our results to smc++ (Terhorst et al., 2017). This application highlights the ability of the network to handle data with a varying number of haplotypes and to quickly perform predictions for datasets including numerous populations.

24/03/2023 : Weighted Socio-Ecological Multiplex Systems, Arnaud Dragicevic (CIRANO, Chulalongkorn University) [distanciel]

Résumé Herein we study a weighted multilayered socio-ecological network system in sustainability, in which a policy reform is applied to one or more layers of the network. We investigate the knock-on effect from this reform and the influence of centrality of nodes in spreading the reform. Our model highlights the properties allowing to reach a positive density of reformed nodes inside a layer and across the layers. The system stability is contingent on the synchronization across the multiplex network. Our results suggest that sustainability may be best achieved when the central nodes are the greatest propagators of an essential reform. In terms of policy-making, in particular on the management and governance of natural resources, our framework offers a brand new perspective on the polycentric governance; it even enriches it through new attributes.

17/03/2023 : Changement climatique et travail scientifique : quantifier le coût environnemental de la recherche ?, Antoine Hardy (Sciences Po Bordeaux)

Résumé Depuis novembre 2020, Antoine Hardy mène, dans le cadre d'une thèse de science politique, une enquête auprès de Labos 1point5, cette initiative qui vise à faire changer les pratiques de recherche au nom de l'urgence environnementale, notamment à travers le développement et la circulation d'un calculateur d'empreinte carbone. Son intervention sera l'occasion de partager des premiers résultats de sa thèse et de décrire ce qui se joue à l'intersection des normes climatiques et scientifiques.

10/03/2023 : Présentation de la nouvelle infrastructure de calcul de la plateforme GenoToul Bioinfo (5000 cœurs, 80TB de RAM, 4*GPU, +2PiB stockage parallèle), Didier Laborie (séminaire interne plateforme bio-info)

Résumé La plateforme Bioinfo GenoToul vient de faire l’acquisition d’une nouvelle infrastructure de calcul pour remplacer ses équipements vieillissants. Il s’agit d’un cluster de calcul fonctionnant à travers SLURM (Simple Linux Utility for Resource Management) composé de :

  • 1 serveur d’administration (provisionnement, monitoring, authentification, ordonnancement des jobs)
  • 2 serveurs de login (accès depuis l’extérieur, transferts, dev, compilation, test et soumission sur le cluster de calcul)
  • 1 serveur de visualisation (bureau à distance, rendu 3D)
  • 1 serveur GP/GPU : pour faire de l’IA
  • 39 nœuds de calcul à forte mémoire RAM (2TB)
  • +2PiB de stockage parallèle (dont 223TiB rapide)
  • Réseau d’interconnexion Infiniband HDR à 100Gbs

24/02/2023 et 03/03/2023  : Pas de séminaire (vacances scolaires)

17/02/2023 : Planta sapiens, Homo stupidus ?, Paco Calvo (Université de Murcie, Espagne)

Résumé Cognitive science provides the means to make headway in the quest for plant intelligence. Contrary to common belief, plants are not merely acted upon; they rather take action autonomously according to their own needs. To do so, self-propelled mobility is needed—although, unlike animal locomotion, plant movement takes the form of growth and development. Unfortunately, the default understanding of the relation between mobility and cognition is by resorting to an orthodox information-processing paradigm. By having an informed debate about the ‘architecture of plant cognition’, we may engage with empirical investigations somewhat differently. Recent research in neural network theory, theoretical neuroscience and perceptual psychology pinpoints to parallel distributed processing, predictive processing, and ecological psychology as fruitful models of cognition. At MINT Lab we re-situate the quest for plant intelligence into a broader approach in cognitive science, as represented by these schools of thought. Plant science can graft onto these investigations and benefit from integrating their theoretical and methodological paradigms. On the other hand, the evolution of sentience has become a hot topic of research in recent years. Cognitive science cannot rule out non-animal forms of life having structures that promote awareness. My talk explores the very possibility and consequences of plant sentience. This approach may ultimately bear upon our understanding of life and cognition more broadly, reaching all the way from single cell organisms to human beings, including plants.

Planta Sapiens: Unmasking Plant Intelligence, Little, Brown & Co, 2022, by Paco Calvo (with Natalie Lawrence).

10/02/2023 : Les nouvelles missions et activités de la plateforme RECORD, Ronan Trepos (séminaire interne, équipe Record)

Résumé L'equipe RECORD vient de redéfinir, avec l'appui du département MathNum, les contours de son projet structurant autour de la modélisation et de la simulation des agroécosystèmes. Depuis 12 ans, l'equipe développe des outils génériques pour la modélisation et la simulation d'agroécosystèmes. Ces outils ont été mobilisés dans de nombreux projets scientifiques. Cependant, il nous semble pertinent aujourd'hui d'adapter nos missions d'une part pour être plus en adéquation avec nos activités quotidiennes et d'autre part pour permettre un élargissement de la communauté d'utilisateurs. Cette présentation sera donc l'occasion d'expliciter ces nouvelles missions et les projets scientifiques et techniques dans lesquels la plateforme est actuellement engagée. Les questions organisationnelles seront également évoquées.

03/02/2023 : Pas de séminaire : animation site web unité

27/01/2023 : Understanding cellular functions with Network Biology, Christine Brun (TAGC, Université Aix-Marseille)

Résumé Je présenterai certains challenges de la biologie des réseaux. Je les illustrerai par nos travaux actuels d'analyse des réseaux d'interactions proteine-proteine et protéine-ARN sur: (i) les fonctions cellulaires des petits ORFs,  (ii) les perturbations de réseaux dans les relations hôte-microbes, (iii) la prise de décision en signalisation.

20/01/2023 : Il était une fois…. un séminaire interne pour les petits et les grands, Patrick Taillandier (séminaire interne SciDyn)

Résumé La recherche, c’est avant tout une affaire de personnes, de destins croisés, de succès et d’échecs. Au travers de ce séminaire, je vous propose de vous conter la petite histoire du projet RAC qui s'intéresse à la gestion des déchets au Vietnam. Au menu : du dépaysement, de l’aventure, du suspens, de l’amitié et bien plus encore ! Venez nombreux !

13/01/2023 : Journée des doctorants Programme

06/01/2023 : Pourquoi et comment démanteler l'IA et le numérique?, Romain Couillet (Université Grenoble-Alpes)

Résumé La civilisation occidentale est engagée depuis 10,000 ans dans un processus technicien, aujourd'hui verrouillé par une ontologie naturaliste (cette vision du monde qui fait de la "nature" le grand supermarché de l'humanité) qui entraîne dans son sillon les dynamiques exponentielles des consumérisme, extractivisme et colonialisme. La conséquence immédiate en est la destruction des écosystèmes (6e extinction de masse, 30x plus rapide que l'extinction du Crétacé et s'accélérant) et le dérèglement des dynamiques géophysiques planétaires (réchauffement, déplétions minérales). De gré ou de force (pic pétrolier, pénuries de ressources, chocs environnementaux et alimentaires), la société occidentale telle que nous la connaissons s'effondrera, vraisemblablement au cours de notre génération. Les technologies numériques, dont le point d'orgue est l'intelligence artificielle (IA), contribuent tout à la fois à la destruction socio-environnementale mais surtout à la perte massive d'outils de résilience (interpénétration de tous les domaines techniques, dépendance au pétrole, dépendance aux machines, dépendance aux décisions automatiques) en vue de la transition post-industrielle (retour à la terre et à l'artisanat), comme l'illustre parfaitement le cas de Cuba en 1990. Dans cette présentation, je ferai dans un premier temps un état des lieux de la situation du numérique et de l'IA, vus par Alexandre Monnin comme des technologies "zombie" (vivantes aujourd'hui mais de fait déjà mortes), et questionnerai les pistes de leur démantèlement nécessaire, de mon point de vue l'axe prioritaire de la recherche numérique aujourd'hui. J'évoquerai dans un second temps la question anthropologique de l'ontologie naturaliste occidentale, absolument unique dans l'histoire de l'humanité, et en conflit avec les connaissances ethnographiques, de psychologie sociale et cognitive modernes: en deux mots, nous n'avons pas besoin d'un nouveau récit pour le monde, mais de retisser les liens animistes avec le vivant qui sont une partie intégrante de notre ADN, aujourd'hui masquée par notre culture et nos tabous auto-destructeurs. Ce travail écopsychologique est, selon moi, la clé de voûte de l'engagement de tou·tes les chercheur·ses-ingénieur·es vers la transition nécessaire, enthousiaste, collective et interspécifique que nous devons mener.

23/12/2022 et 30/12/2022  : Pas de séminaire (vacances scolaires)

16/12/2022 : Contribution to the Application of Machine Learning in Real-Time Scenarios (Malware Detection, Industry 4.0, and Environmental Soft-Sensors), Stanislav Vakaruk (Université de Madrid, visiteur à MIAT)

Résumé Machine Learning and Deep Learning methods can be applied in almost any field to solve some type of problem, usually requiring a labeled dataset (preferably large). In addition to the fact that these techniques or models learn to solve problems without explicit programming, they can solve them fast enough to be incorporated into a real-time solution.

In this presentation, I will talk about a set of innovative solutions that we have found over the last three years in a variety of fields. In the field of network malware detection, we have shown that it is possible to detect cryptomining connections even if they are encrypted. In the field of Industry 4.0, we have shown that it is possible to predict the deviation of an Automatic Guided Vehicle (AGV) connected by a 5G connection to a controller on an EDGE device even under unstable network situations. In the environmental field, we have designed a Chl-a soft-sensor from low-cost variables in a freshwater concentration.

09/12/2022 : Présentation du métaprogramme Xrisques, Stéphane Couture

Résumé Le Métaprogramme XRISQUES se propose d’étendre les recherches interdisciplinaires réalisées en risque spécifique à des situations de risques multiples dans un contexte de changements globaux. L’enjeu du Métaprogramme XRisques est de mieux comprendre les risques multiples pesant sur les systèmes agricoles, alimentaires et environnementaux, en particulier ceux plus spécifiques liés à la gestion des transitions ou soumis à des évolutions rapides. Le Métaprogramme XRisques a pour objectifs d’établir les connexions entre des risques de natures variées, de considérer les processus de propagation de risques en interaction, de mieux appréhender la vulnérabilité des systèmes dans leur globalité, leur diversité et leur complexité, mais aussi de confronter les différentes visions des risques (Comportement et perception par les acteurs) qui permettront de faire émerger des stratégies de gestion, de prévention et de couverture, de résolution et de communication, ainsi que des actions et politiques publiques. Je vous présenterai ce nouveau métaprogramme ainsi que les actions futures envisagées dans le cadre de ce métaprogramme mais des métaprogrammes en général.

02/12/2022 : ASTERICS : une application web pour intégrer des données omiques, Elise Maigné et Nathalie Vialaneix (Séminaire interne SAaB)

Résumé Dans cette présentation, on vous parlera de l’application ASTERICS https://asterics.miat.inrae.fr (pour réaliser des analyses statistiques exploratoires et intégratives) ainsi que des solutions techniques que l’on a sélectionnées pour la développer et la déployer avec docker. Il y en aura pour tout le monde : description des méthodes et de leurs usages, démonstration sur des données omiques de cancer et description (naïve) des choix techniques basés sur Rserve, renv, flask, Vue.js et leurs amis. En bref, ce sera très pédagogique.

25/11/2022 : [Date bloquée]

18/11/2022 : Eco-conception de procédés durables, Sophie Thiebaud-Roux et Pierre-Yves Pontalier (LCA, INRAE) [présentiel]

Résumé Le Laboratoire de chimie agro-industrielle est une unité de recherche qui travaille sur la valorisation de la biomasse végétale, principalement les coproduits et les résidus des industries agricoles. C’est une unité à forte vocation expérimentale qui essaye de développer des nouveaux procédés plus respectueux de l’environnement. L’analyse de cycle de vie est donc intégrée dans les travaux car c’est une approche qui permet de déterminer l’impact environnemental d’un processus ou d’un produit, en prenant en compte toutes les étapes, de sa fabrication et sa destruction. L’analyse de cycle de vie est généralement réalisée à partir de logiciels, le logiciel utilisé au LCA est Simapro®, qui intègrent une base de données et un calculateur pour la détermination des impacts environnementaux.

L’utilisation de cette méthodologie pour des procédés en cours de conception est plus récente et permet d’orienter dès la phase de développement vers les procédés les plus respectueux ou d’optimiser des conditions opératoires en intégrant à la fois la productivité et l’impact environnemental. Ce type d’approche nécessite de pouvoir introduire des données liées aux conditions de fonctionnement dans le logiciel utilisé pour l’analyse de cycle de vie. Ces données peuvent être expérimentales, obtenues par exemple dans le cadre d’un plan d’expérience.

Une autre approche serait le couplage du logiciel d’analyse de cycle de vie avec un logiciel de simulation de procédés. Le logiciel utilisé au LCA est Prosim® car il permet de dimensionner un procédé et de calculer les flux matières/énergie à partir d’une base de données en thermodynamique. Mas il est surtout adapté aux procédés pétrochimiques, ce qui nécessite de développer des modules spécifiques de simulation pour les opérations unitaires, comme la filtration membranaire ou les procédés chromatographiques, plus spécifiquement utilisées dans le fractionnement de la biomasse végétale.

La chromatographie est un procédé qui peut être décrit comme un écoulement d’un fluide dans un milieu poreux. Ce fluide transporte des molécules qui peuvent avoir des interactions avec le milieu poreux en fonction de leur taille et/ou de leur structure chimique. L’enjeu est donc d’être capable de simuler le transport réactif de ces molécules. Un modèle introduit dans un module de Prosim® permettra alors de simuler un procédé utilisant une étape de filtration. Il faut ensuite être capable de coupler les deux logiciels afin que les informations acquises sous Prosim® puisse devenir les données pour le calcul sous Simapro®.

11/11/2022  : Pas de séminaire (jour férié)

28/10/2022 et 04/11/2022  : Pas de séminaire (vacances scolaires)

21/10/2022 : Apprentissage logique pour la modélisation dynamique qualitative des réseaux de régulation. Samuel Buchet

Résumé La compréhension des mécanismes cellulaires repose souvent sur l’étude de l'expression génétique. Les gènes sont cependant impliqués dans des processus de régulation complexes et leur mesure est difficile à réaliser. Dans ce contexte, la modélisation qualitative des réseaux de régulation vise à établir leur fonction à partir d’un réseau d’interaction dynamique discret. Ce travail aborde la mise en place d'une telle approche à partir des données de séquençage single-cell (RNA-seq). Ces données se révèlent en effet intéressantes pour la modélisation qualitative, car elles apportent une certaine précision et peuvent être interprétées de manière dynamique. Nous développons ainsi une méthode d’inférence de modèles qualitatifs basée sur l’apprentissage automatique de programmes logiques, formulé comme un problème d'optimisation. Cette méthode est mise en œuvre sur des données single-cell et nous proposons plusieurs approches pour interpréter les modèles résultants en les confrontant avec des connaissances préétablies.

14/10/2022 : Apport des longues lectures en métagénomique. Jean Mainguy (Séminaire interne, plateforme Bioinformatique)

Résumé Depuis la fin des années 2000, on utilise des gènes marqueurs pour étudier la composition des communautés microbiennes dans les écosystèmes d'intérêt. Il s’agit du métabarcoding. L’un des gènes les plus communément utilisé est le gène de l’ARN 16S, mais les technologies de séquençage suffisamment précises pour ce type d’étude ne permettaient d’en obtenir qu’une petite partie (< 500pb). Depuis quelques années sont apparues des longues lectures de bonne qualité ce qui permet de lever ce verrou de la taille du marqueur (~5000pb). L’axe 3 du projet seqOccIn avait pour objectif de revisiter ces pratiques et de tester les nouvelles possibilités permises par ces lectures longues de bonne qualité. Lors de ce séminaire je vais, dans une première partie, vous présenter nos conclusions sur ces aspects. Étudier la composition bactérienne d’un milieu mène souvent à une seconde question : que savent faire ces bactéries ? Pour y répondre, il est possible, bien que plus onéreux, de séquencer l’ensemble des génomes et non plus seulement un gène marqueur. Il s'agit de la métagénomique. Je vous présenterai, dans une seconde partie, les grandes étapes de ce type d’analyse et mettrai l’accent sur les apports et problèmes posés par l’utilisation des longues lectures dans ce cas.

07/10/2022 : Nonstationary Nearest Neighbor Gaussian Process: hierarchical model architecture and MCMC sampling. Sébastien Coube [présentiel]

Résumé Ce travail explore une formulation non-stationaire les modèles Bayésiens hiérarchiques spatiaux utilisant les Processus Gaussiens des Plus Proches voisins. Dans le but de rendre le modèle facile à utiliser, une paramétrisation intuitive (autant que faire se peut) est proposée. Cela permet notemment d'intégrer les modèles non-stationaires dans une famille façon poupées Russes, où les modèles simples sont des états des modèles compliqués mais pas de modèles radicalement différents. Ces modèles hiérarchiques avec un grand nombre de paramètres à haut niveau posent des problèmes d'ordre computationnel, et des stratégies Monte-Carlo basées sur les méthodes hamiltoniennes et les décorrélations par entrelacement de paramétrisations sont proposées. Enfin, une étude de la pollution au plomb aux Etats-Unis d'Amérique est proposée, où une formulation non-stationaire apporte des améliorations des performances prédictives du modèle et permet une interprétation plus riche.

30/09/2022 : Learning common structures in a collection of networks. An application to food webs. Sophie Donnet (MIA Paris-Saclay, INRAE) [distanciel]

Résumé Let a collection of networks represent interactions within several (social or ecological) systems. Two main issues arise: identifying similarities between the topological structures of the networks or clustering the networks according to the similarities in their structures. We tackle these two questions with a probabilistic model based approach. We propose an extension of the Stochastic Block Model (SBM) adapted to the joint modeling of a collection of networks. The networks in the collection are assumed to be independent realizations of SBMs. The common connectivity structure is imposed through the equality of some parameters. The model parameters are estimated with a variational Expectation-Maximization (EM) algorithm. We derive an ad-hoc penalized likelihood criterion to select the number of blocks and to assess the adequacy of the consensus found between the structures of the different networks. This same criterion can also be used to cluster networks on the basis of their connectivity structure. It thus provides a partition of the collection into subsets of structurally homogeneous networks. The relevance of our proposition is assessed on two collections of ecological networks. First, an application to three stream food webs reveals the homogeneity of their structures and the correspondence between groups of species in different ecosystems playing equivalent ecological roles. Moreover, the joint analysis allows a finer analysis of the structure of smaller networks. Second, we cluster 67 food webs according to their connectivity structures and demonstrate that five mesoscale structures are sufficient to describe this collection. (Joint Work with Saint Clair Chabert Liddell et Pierre Barbillon.)

23/09/2022 : Simulation multi-agent interactive: engager des populations locales dans la modélisation des socio-écosystèmes pour stimuler l’apprentissage social. Christophe Le Page (CIRAD) [présentiel]

Résumé Mes travaux ont pour but de renforcer les capacités des acteurs les moins favorisés des socio-écosystèmes à prendre part à des ateliers de concertation multi-acteurs. Ils reposent sur le postulat qu’une concertation effective demande un partage équilibré des différents points de vue des protagonistes. Pour partager des points de vue, il faut que chacun puisse exprimer le sien de manière intelligible pour les autres. En employant une démarche inductive, j’ai progressivement dessiné les contours d’une approche de modélisation participative qui positionne la simulation multi-agent interactive en vecteur de communication adapté au partage de points de vue sur le fonctionnement des socio-écosystèmes. Cette approche est implémentée en suivant les quatre étapes suivantes : i) constituer un groupe composé de 2-3 chercheurs pour élaborer une ébauche d’un modèle de simulation multi-agent proposant une représentation du système-cible stylisée, volontairement simpliste, et manipulable en mode interactif (les actions des agents sont décidées par les participants), ii) inviter un petit groupe d’acteurs locaux (une quinzaine de personnes) à un premier atelier pour « tester » cette première version et identifier tous les aspects nécessitant à leurs yeux d’être repris ou intégrés dans le modèle pour que celui-ci constitue une représentation du système-cible permettant de mettre en discussion une problématique formulée collectivement, iii) organiser une série d’ateliers de co-construction basés sur le test de la version actualisée du simulateur impliquant le groupe de co-designers composé des chercheurs et des acteurs locaux, iv) utiliser la version finalisée du simulateur au cours d’ateliers co-animés par un groupe réduit de co-designers auxquels sont conviés d’autres types d’acteurs pour « tester » (selon les principes énoncés au point ii) cette version. Initier le processus avec un objet intermédiaire de type empirique-stylisé prenant la forme d’une ébauche présente des avantages : on simule une complexité manipulable dont la forme générale est esquissée. On peut y trouver les grands traits de l’objet futur. L’objet est cependant clairement inachevé : il reste un important travail de façonnage et de perfectionnement progressif pour que l’objet acquière sa forme finale et devienne fonctionnel. Le flou et les imprécisions, propres à une ébauche, sont susceptibles de stimuler la collaboration transdisciplinaire.

16/09/2022 : Une approche de biologie synthétique pour déconstruire et reconstruire la pathogénie d’une bactérie sur les plantes. Laurent Noel et Emmanuelle Lauber (LIPME, INRAE) [présentiel]

Résumé Les déterminants de la pathogénie et de la spécificité d’hôte des bactéries pathogènes des plantes sont méconnus et pourraient faire intervenir des facteurs de virulence tels que le système de sécrétion de type 3 (T3SS) et ses protéines effectricess associées (ET3). Nous avons créé une souche non pathogène de la bactérie Xanthomonas campestris pv campestris (Xcc) délétée de l’ensemble de ses ET3 connus (effectome). Nous étudions le rôle des ET3 dans la spécificité d’hôte en ré-introduisant dans cette souche une banque de plasmides générée par biologie synthétique contenant des combinaisons aléatoires de 6 effecteurs. La banque est ensuite testée sur différentes plantes hôtes et non hôtes de Xcc. Les combinaisons d’effecteurs capables de restaurer la croissance bactérienne dans les différents hôtes seront identifiées par séquençage en masse et validées en réalisant des tests de pouvoir pathogène. A partir de cet échantillonnage d’effectome, des approches de modélisation de l’effectome seront nécessaires pour identifier les contributions individuelles des ET3 à la pathogénie et les propriétés émergentes des combinatoires d’ET3 sur différentes plantes : redondance, épistasie, synergie, sans fonction. Ce travail nous renseignera sur la compréhension moléculaire de la spécificité d’hôte conférée par les ET3.

09/09/2022 : Statistical multivariate modelling of omics data with copulas. Gildas Mazo (MaIAGE, INRAE) [présentiel]

Résumé Many omics data produced by next generation sequencing technologies are of different types (e.g., discrete read counts and continuous methylation data). From an integrative biology viewpoint, this makes the building of statistical models difficult. To address this issue, one can rely on copula theory to effectively build multivariate models by "adding" a dependence structure to "couple" arbitrary random variables. However, doing the inference in copula-based models with heterogeneous datasets is challenging, because the log-likelihood is complex and becomes untractable when the dimension increases. To alleviate this issue, a randomized pairwise likelihood method is presented. Randomization allows us to control the tradeoff between statistical and computational efficiency. The method is illustrated in theory, on simulations, and on a RNA-seq dataset. Future directions of research are discussed.

Séminaires reportés à une date ultérieure

Séminaires passés / Past seminars

Lien vers la Liste des séminaires passés de l'unité MIAT.

Contacts

Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter Céline Brouard et Sandra Plancade.

Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels