Séminaires

De MIAT INRA
Révision datée du 23 novembre 2021 à 17:41 par Cebrouard (discussion | contributions) (Séminaires de l'année en cours et séminaires futurs)
Aller à : navigation, rechercher

Sommaire

Séminaires de l'unité MIAT

Pyrenees-morning.jpg

Le séminaire de l'équipe MIAT d'INRAe Toulouse est un endroit d'échanges scientifiques et techniques entre les membre de l'unité et des experts en mathématiques, informatique, agro-écosystèmes, bioinformatique, etc. Les présentations peuvent être sur des travaux en cours, des projets finalisés hautement spécialisés ou à valeur plus éducative / informationnelle. Les aspects mis en avant peuvent être d'ordre méthodologique ou applicatif.

Les présentations peuvent être en français ou en anglais pour une durée d'une heure (45min + questions). Sauf contre-indication, les séminaires ont lieu dans la salle de réunion MIAT à 10h30 le vendredi. L'accès à l'unité MIAT d'INRAe Auzeville/Castanet est indiqué ici (nous sommes à moins de 30 mètres de la réception !).

Séminaires de l'année en cours et séminaires futurs

15/04/2022 : Titre à venir (Séminaire interne, équipe Scidyn)

01/04/2022 :

25/03/2022 :

18/03/2022 : Titre à venir (Séminaire interne, plateforme Record)

11/03/2022 : Titre à venir Lise Pomies (MIAT) [présentiel]

25/02/2022 et 04/03/2022 : pas de séminaire (vacances scolaires)

18/02/2022 : Titre à venir Rémi Mahmoud (INRAE AGIR) [présentiel]

11/02/2022 : Titre à venir Dino Ienco (INRAE TETIS) [présentiel]

04/02/2022 : Titre à venir (Séminaire interne, équipe SaAB)

28/01/2022 : Titre à venir Camille Marchet (CNRS, Université de Lille) [présentiel]

21/01/2022 : Titre à venir Juliette Chevalier (INSA Toulouse/IMT) [présentiel]

14/01/2022 :

07/01/2022 : Titre à venir (Séminaire interne, plateforme Bioinformatique)

24/12/2021 et 31/12/2021 : pas de séminaire (vacances scolaires)

17/12/2021 : Titre à venir Timothée Vergne (ENVT) [présentiel]

10/12/2021 : Séminaire des doctorants [mixte présentiel/distanciel]

03/12/2021 : Modèles de mutation et "analyse de fluctuation" Adrien Mazoyer (IMT, UPS)[présentiel]

Résumé : Les modèles de mutations décrivent le processus d’apparitions rares et aléatoires de mutations au cours de la croissance d’une population de cellules. Les échantillons obtenus sont constitués de nombres finaux de cellules mutantes, qui peuvent être couplés avec des nombres totaux de cellules ou un nombre moyen de cellules en fin d’expérience. Le modèle classique, dit de Luria-Delbrück, suppose que les développements cellulaires des cellules s’effectue selon un processus de Yule. On peut dans ce cas expliciter la loi du nombre final de mutantes, en fonction de différents paramètres. Elle dépend en particulier du nombre moyen de mutations. Au vu d’un échantillon de nombres finaux de mutantes, on est alors en mesure d’estimer le nombre moyen de mutation et d’en déduire une estimation de la probabilité d’apparition d’une mutation au cours d’une division cellulaire qui est le véritable paramètre d’intérêt. L’estimation de cette probabilité est d’une importance cruciale dans plusieurs domaines de la médecine et de biologie : rechute de cancer, résistance aux antibiotiques de Mycobacterium Tuberculosis, etc. Cependant, les hypothèses de modélisation classiques sont irréalistes : durées de vie exponentielles, indépendance, taille finale de la population constante, absence de mort cellulaire… Il est donc nécessaire de disposer de méthodes d’estimation robustes pour lesquelles le biais, en particulier sur la probabilité de mutation, reste le moins sensible possible aux hypothèses de modélisation. Dans cet exposé, nous présenterons un modèle de mutations permettant de considérer des processus de croissance inhomogènes en temps, tout en généralisant les extensions déjà étudiées. Le problème statistique sera également traité : différentes méthodes d’estimation seront exposées, et quelques sources de biais seront illustrées à l’aide d’études de simulation. Tous les résultats présents dans cet exposé ont par ailleurs été implémentés sous forme d’un package R qui sera brièvement présenté.

26/11/2021 : Incertitudes et Risques dans certaines approches développées au sein de l'équipe Scidyn : quelques exemples illustratifs liés aux risques naturels Patrick Taillandier et Stephane Couture (Séminaire interne Scidyn) [distanciel]

Résumé : Nous présenterons la manière dont les incertitudes et les risques sont appréhendés dans certaines approches développées au sein de l'équipe SCIDYN. Plus précisément nous ciblerons deux approches, portant sur la modélisation et la simulation des comportements d’agents décisionnels, les Processus Décisionnels de Markov et la Simulation à base d'Agents. Ces avancées méthodologiques seront illustrées avec quelques exemples liés aux risques naturels. Nous décrirons aussi brièvement la proposition du projet européen CAESAR (Coping and Adapting with Extreme climate risks by building Sustainable and All-round Resilience) en quête de financement, lié à cette thématique.​

19/11/2021 : Stratégies de ré-analyse d'un essai de prévention du déclin des fonctions cognitives non concluant​ Céline Bougel (visiteuse scientifique IMABS, INRAE) [présentiel]

Résumé : Contexte : Les essais cliniques demeurent le gold standard pour évaluer l’efficacité d’un traitement, y compris dans le domaine de la prévention. Un essai non concluant se traduit souvent par l’absence d’effet du traitement, alors qu’une méthodologie non optimale peut être en cause. Dans ce travail, nous abordons les essais de prévention, dont l’objectif est de retarder le déclin des fonctions cognitives car les résultats des grands essais dans ce domaine sont peu convaincants. Nous avons fait l’hypothèse que les spécificités de ces essais (données répétées, éventuel effet d’apprentissage, longue phase de latence avant de pouvoir détecter un effet, incertitude de mesure, population hétérogène. . . ) pourraient être mieux appréhendées au moment de l’analyse.
Méthodes : Pour chaque difficulté méthodologique, des méthodes d’analyse spécifiques ont été proposées pour optimiser la détection d’un effet potentiel. Le caractère longitudinal des données est un aspect fondamental que nous prenons en compte dans les analyses, soit en utilisant la trajectoire, soit en utilisant des paramètres représentatifs de son évolution (taux d’accroissement, transition entre états). L’hétérogénéité de la population est explorée par des méthodes de clustering fonctionnel basées sur la forme de la trajectoire ou des méthodes nécessitant un paramètre de synthèse (classification ascendante hiérarchique, sémiologie graphique). L’incertitude de la mesure a été abordée par l’analyse de sujets répondeurs au traitement ou par des modèles de Markov cachés. Une méthode d’apprentissage statistique par renforcement a été utilisée pour traiter l’effet retardé du traitement préventif.
Résultats : Différentes méthodes d’analyses ont été appliquées aux données réelles de l’essai Multidomain Alzheimer Preventive Trial. Les analyses ont indiqué que la population n’évoluait pas comme attendu cliniquement mais avait un niveau cognitif global stable sur les 3 ans de suivi. La composition des profils d’évolution différait selon la méthode utilisée. Les k-means pour données longitudinales avec reconnaissance de la forme de la trajectoire et l’analyse des répondeurs ont mis en évidence un groupe déclinant au cours du suivi. La classification ascendance hiérarchique et la sémiologie graphique ont toutes deux confirmé que la majorité des sujets de l’étude étaient stables cognitivement.
Conclusion : Dans le cadre d’un essai de prévention, les données peuvent être ré-analysées par des méthodes non mobilisées habituellement. Des étapes préalables de prétraitement des données s’avèrent nécessaires pour certaines analyses. Nous avons mobilisé des méthodes qui nous paraissaient appropriées pour mieux prendre en compte certaines limites méthodologiques, le but n’étant pas d’atteindre l’exhaustivité ni de revenir sur la conclusion de l’essai. Au total, nous n’avons pas identifié une méthode à utiliser préférentiellement dans un essai de prévention car chacune des méthodes a pu répondre à une limite mais pas à l’ensemble des limites méthodologiques. D’autres travaux sont nécessaires pour répondre à l’ensemble des particularités méthodologiques. Mots clés : essai de prévention, cognition, donnée longitudinale, paramètre de synthèse, analyses statistiques

27/10/2021 à 14h : Soutenance de thèse de Nathanaël Randriamihamison

29/10/2021, 05/11/2021 et 12/11/2021 : Vacances scolaires et pont de la Toussaint - pas de séminaire

22/10/2021 : Modélisation de l’évolution des résistances aux fongicides, étude nationale et pluri-annelle chez Zymoseptoria tritici en France Maxime Garnault (INRAE AGIR) diaporama

Résumé : La septoriose (Zymoseptoria tritici) est une maladie majeure sur blé dont le contrôle repose encore principalement sur l'utilisation de fongicides. Cependant, la durabilité des substances actives est érodée par l'émergence de mutants résistants à une ou plusieurs substances. En France depuis 2004, le réseau Performance (Arvalis-INRAE) suit l’évolution des fréquences de ces résistances dans les populations de septoriose.
L'analyse statistique des données récoltées a permis de quantifier l'hétérogénéité spatiale de la sélection des résistances à 3 grandes familles de fongicides. Les taux de croissance estimés mettent en évidence des vitesses d’évolution significativement différentes, entre les résistances et les régions. Ces différences ont ensuite été analysées au regard de trois déterminants majeurs : (i) l'utilisation des fongicides (pression de sélection), (ii) la fraction des surfaces non traitées (refuges) et (iii) la nuisibilité de la septoriose (taille de population).
Conclusion : Ces travaux sur l’évolution des résistances à l’échelle régionale viennent compléter ceux déjà existants à la parcelle ou au paysage. En s’appuyant sur de nouvelles données, ils peuvent aider à fournir une prédiction court terme de l’évolution en fréquence d’une résistance émergée.

18/10/2021 à 14h : Soutenance de thèse de Leila Khajavi

15/10/2021 : Résoudre un problème d'optimisation exprimé par un réseau de fonctions de coûts avec toulbar2 et les services Web Simon de Givry et Nathalie Rousse (Séminaire interne, équipe SaAB)

Résumé : Nous montrons comment un problème d'optimisation sous contraintes peut se modéliser sous forme d'un réseau de fonctions de coûts. Après avoir introduit ce cadre de modélisation par rapport à d'autres cadres existants, nous prenons comme exemple le problème de conception d'un emploi du temps dans une université. Partant d'une précédente modélisation en programmation par contraintes, nous décrivons sa modélisation en un réseau de fonctions de coût. Nous introduisons ensuite le solveur toulbar2 développé en partie dans l'équipe SaAB et présentons des résultats comparatifs préliminaires sur le problème d'emploi du temps. En terme de mise en oeuvre, nous présenterons la manière dont nous utilisons des services web pour lancer des résolutions de ce problème, et nous évoquerons des cas d'utilisation de services web autour de toulbar2 auxquels nous réfléchissons.

08/10/2021 : Time series classification: recent advances and challenges Charlotte Pelletier (IRISA, Université Bretagne Sud) diaporama

Résumé : Time-series data, which are ordered sequences of numerical or symbolic values, are nowadays ubiquitous. They are growing in quantity and velocity as the number of sensors (weather stations, surgical robots, body sensors, and many more) increases. Their analysis is fundamental in a variety of applications including food security, environment, medicine, and human activity recognition. Among possible analysis tasks, time series classification (TSC) consists of associating a time series with a label. As traditional classification approaches (e.g., random forests) fail to exploit the temporal structure of these data and their particularities (temporal relationships between consecutive observations, irregular sampling, high volume, etc.), specific methods have been proposed to automatically classify unlabelled time series in a reasonable amount of time.
In this talk I will present the different families of TSC approaches with a focus on recent advances, which are looking for a good tradeoff between accuracy and scalability. I will detail novel approaches based on decision trees and deep learning techniques. I will also briefly outline some applications and challenges of TSC to remote sensing data in the context of land cover mapping.

01/10/2021 : Some ideas to reconcile orthology with deep learning to predict regulatory regions using convolutional and graph neural networks Raphaël Mourad (IBCG, Université Toulouse 3 & Délégation INRAE MIAT)

Résumé : Current deep learning methods, eg CNNs, for functional element prediction are aimed to be trained on one species (eg human) and to predict on the same species (eg human). This is a very strong limit of such model for annotating newly sequenced genomes. Formalizing the annotation task as a GNN connecting species allows to generalize CNNs to predict annotations across species, in a very natural way.

24/09/2021 8h50-12h30 : Journée « Impact carbone de la recherche et du numérique » dans le cadre des animations IMABS

17/09/2021 : SHAMAN: a user-friendly website for metataxonomic analysis from raw reads to statistical analysis Amine Ghozlane (Institut Pasteur) diaporama

Résumé : Comparing the composition of microbial communities among groups of interest (e.g., patients vs healthy individuals) is a central aspect in microbiome research. It typically involves sequencing, data processing, statistical analysis and graphical display. Such an analysis is normally obtained by using a set of different applications that require specific expertise for installation, data processing and in some cases, programming skills. Here, we present SHAMAN, an interactive web application we developed in order to facilitate the use of (i) a bioinformatic workflow for metataxonomic analysis, (ii) a reliable statistical modelling and (iii) to provide the largest panel of interactive visualizations among the applications that are currently available. SHAMAN is specifically designed for non-expert users. A strong benefit is to use an integrated version of the different analytic steps underlying a proper metagenomic analysis. The application is freely accessible at http://shaman.pasteur.fr/, and may also work as a standalone application with a Docker container (aghozlane/shaman). The source code is written in R and is available at https://github.com/aghozlane/shaman.
Référence

10/09/2021 : Détection de méthylation de l’ADN à partir de lecture ONT Paul Terzian (Séminaire interne, plateforme Bioinformatique)

Résumé : Les modifications de l’ADN et en particulier la méthylation des cytosines en 5mC sont un sujet d’étude important en épigénomique. En effet, il a été montré que cette modification pouvait avoir le rôle de marqueur épigénétique chez les animaux, c’est-à-dire avoir un rôle dans le contrôle de l’expression de gènes. Jusqu’à présent, la méthode de détection de méthylation de référence est le WGBS qui nécessite de traiter chimiquement l’ADN et qui ne produit que des lectures courtes.
Aujourd’hui nous nous intéresseront au séquençage par nanopore (ONT) qui permet de séquencer des longues lectures et de détecter les modifications de l’ADN, dont la méthylation des cytosines, simultanément et sans traitement de l’ADN au préalable. En revanche cette approche reste encore instable, aussi bien en matière de matériel de séquençage qu’en matière de logiciel. Dans cette présentation j’introduirais le concept de séquençage nanopore ainsi que son apport pour les analyses de méthylation. Je parlerais ensuite de notre travail visant à acquérir une expertise sur ces nouvelles méthodes et à améliorer la qualité des résultats obtenus (entraînement de nouveaux modèles de prédictions). Ce travail est réalisé dans le cadre du projet SeqOccIn, porté par les plateformes Get et Bioinfo de Genotoul.

03/09/2021 : Interconnexion de réseaux de régulation cellulaire - Application au cycle de division et à l'horloge circadienne Laurent Tournier (INRAE, MaIAGE)

Résumé : Les systèmes dynamiques discrets, en particulier les réseaux Booléens asynchrones, constituent un outil intéressant pour modéliser la dynamique de réseaux de régulation cellulaire. Ils permettent une analyse qualitative, bien adaptée pour capturer certains comportements asymptotiques clés de ces réseaux. Ils sont utilisés notamment pour représenter des réseaux de décision (survie/mort cellulaire) ou encore, plus récemment, des oscillateurs biologiques. Dans cette présentation, nous décrirons le cadre des réseaux Booléens asynchrones et nous verrons comment les utiliser pour modéliser des réseaux cellulaires. Nous proposons en particulier deux méthodes originales pour interconnecter plusieurs réseaux entre eux. Nous appliquons ces résultats à deux oscillateurs biologiques centraux dans les cellules mammifères : le cycle de division et l’horloge circadienne. Ces travaux, encore en cours, sont réalisés en partie dans le cadre du projet ANR ICycle (2017-21).

Séminaires reportés à une date ultérieure

KeOps: Kernel Operations on the GPU, with autodiff, without memory overflows. Benjamin Charlier (Université de Montpellier, ARAMIS)

Résumé : The KeOps library lets you compute generic reductions of large 2d arrays whose entries are given by a mathematical formula. It is perfectly suited to the computation of convolutions (or more generally to Kernel dot products) and the associated gradients (with an automatic differentiation engine).
KeOps is fast as it allows you to compute Gaussian convolution up to 40 times faster than a standard tensor algebra library that use GPU. KeOps is scalable and can be used on large data (typically from n=10^3 to n=10^7 number of rows/columns): it combines a tiled reduction scheme and works even when the full kernel matrix does not/fit into the GPU memory. Finally, KeOps is easy to use as it comes with its Matlab, Python (NumPy or PyTorch) and R bindings.
Web site: http://www.kernel-operations.io

Séminaires passés / Past seminars

Lien vers la Liste des séminaires passés de l'unité MIAT.

Contacts

Si vous souhaitez présentez vos travaux durant le séminaire MIAT, n'hésitez pas à contacter Céline Brouard ou Sandra Plancade.

Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels