Deep learning pour l’amélioration d’assemblages
- Directeurs de thèse : Matthias Zytnicki (MIAT, INRAE), Raphaël Mourad (MIAT, INRAE), Guillermina Hernandez-Raquet (INRAE, TBI)
- Début de thèse : 1 novembre 2024
- École doctorale : MITT
- Établissement : Université Paul Sabatier
- Financement : 50% Région Occitanie + 50% EUR BioEco
Résumé : La compréhension du fonctionnement des consortia microbiennes lignocellulolytiques est indispensable pour développer des procédés efficaces de bioconversion de la biomasse. Cela est possible qu’au travers d’une meilleure connaissance de leur contenu génomique au quel on a accès par des approches de séquençage métagénomique shotgun et reconstruction des espèces métagénomiques (MAGs ou metagenomic assembled genomes) . Depuis peu, de nouvelles techniques de séquençage permettent d’obtenir des lectures longues, et presque sans erreur. Ces données rendent enfin l’assemblage de génomes complets à la portée de tous. Pour autant, de nouvelles méthodes doivent être développées afin d’exploiter au mieux ces données : proposer des assemblage dont la taille est au plus proche des génomes, avec le moins d’erreurs possible. Dans ce contexte, l’intelligence artificielle, et notamment le deep learning, sont en plein boom et révolutionnent la science avec AlphaFold, pour la prédiction de structures de protéines 3D. Dans le cadre de cette thèse, nous nous proposons d’utiliser les nouvelles méthodes mises au point en deep learning, pour améliorer les assemblages de génomes (MAGs) à partir des données métagénomiques.