Catégorie:SaAB

De MIAT INRA
Aller à : navigation, rechercher

Statistiques et Algorithmique pour la Biologie (SaAB)

Responsable de l'équipe : Thomas SCHIEX (0561285428) Thomas[dot]Schiex[at]toulouse[dot]inra[dot]fr

Membres de l'équipe

Thèses/Post-docs/CDD


L'équipe a pour objectif de développer et de mettre à disposition des biologistes des méthodes mathématiques, statistiques et informatiques permettant de contribuer à la compréhension du vivant.

Problèmes bioinformatiques abordés

C'est plus particulièrement la localisation et l'identification d'éléments fonctionnels dans les génomes des bactéries, plantes et animaux qui caractérise les activités de recherche de l'équipe et ce, à différents niveaux:

  • au niveau génétique: un génome est essentiellement perçu au travers de petites régions caractérisées (les marqueurs moléculaires) qui forment des balises. Il s'agit alors de positionner ces balises sur les chromosomes (cartographie génétique et d'hybrides irradiés: Carthagène) pour ensuite localiser des régions liées à des caractères d'intérêt (résistances aux maladies, rendement...) par rapport à ces balises (localisation de QTL ou Quantitative Trait Loci par analyse de la transmission allélique : MCQTL et par modélisation du déséquilibre de liaison : HAPim ). Ces données peuvent être ensuite utilisées en sélection de variétés combinant plusieurs caractères désirables.
  • au niveau moléculaire: c'est directement la séquence d'ADN du génome qui est analysée pour la décoder et identifier les régions fonctionnelles dans la séquence. Il peut s'agir de gènes codant pour des protéines (dans des génomes bactériens: FrameD ou eucaryotes: EuGène) ou de gènes non traduits et correspondant à des ARNs fonctionnels (MilPat, DARN!, ApolloRNA,RNAspace). La comparaison de génomes d'espèces différentes et l'identification des évènements fondamentaux qui les séparent (remaniements) peuvent permettre le transfert d'information entre génomes.
  • au niveau de l'expression de gènes: l'utilisation de données de type "puce à ADN" permet de partiellement observer l'activité cellulaire à un instant donné. Il est alors possible d'établir un lien entre les conditions d'observation de la cellule (maladie, milieu pollué) et les gènes qui sont sur (ou sous) exprimés. Ce lien peut permettre de remonter aux gènes liés à la maladie ou permettre un diagnostic.

Pour aller au delà de la localisation d'éléments fonctionnels isolés, nous nous intéressons à l'inférence de réseaux de régulation génique. Pour dépasser la simple utilisation de données d'expression, c'est la combinaison de ces données d'expression et de polymorphisme (SNP) sur une collection d'individus, permettant l'observation de différents modes de fonctionnement du réseau, qui est étudié.


Des liens solides lient l'équipe aux laboratoires proches de Génétique Cellulaire, d'Interactions Plantes/Micro-organismes et de Génétique Animale.


Méthodes statistiques et informatiques


Pour traiter ces problèmes, l'équipe mobilise et développe des méthodes en mathématiques, statistiques, probabilités (modélisation, inférence, modèles de mélanges, régression pénalisée, modèles graphiques, processus) et en informatique (modélisation, optimisation combinatoire, réseaux de contraintes, algorithmique) avec le but de valoriser les méthodes développées dans des outils logiciels directement utilisables par nos partenaires biologistes et rendant compte le mieux possible de la complexité et de la variété des données utilisables.

L'équipe développe en particulier des méthodes originales dans le domaine de l'optimisation combinatoire, en s'appuyant sur les réseaux de contraintes pondérées, aussi appelés "réseaux de fonctions de coût", un type de modèle graphique dédié à l'optimisation et généralisant les réseaux de contraintes utilisés en programmation par contraintes. Ces techniques, implémentées dans l'outil toulbar2 (développé dans l'équipe et très bien placé dans différentes compétitions internationales), sont ensuite mise en oeuvre sur des problèmes issus de la bioinformatique (localisation d'ARNs de familles connues, diagnostics de pedigrees complexes de grande taille...).


Sur la thématique des réseaux de contraintes pondérées, nos partenaires les plus proches sont l'Institut de Recherche en Informatique de Toulouse et le centre de recherche de Toulouse de l'ONERA. Toulbar2 profite également de collaborations avec l'Université Polytechnique de Catalogne et l'Institut de recherche en Intelligence Artificielle de Barcelone (CSIC).


Publications récentes (journaux, conférences et livres)

Publications 2005-09 de l'équipe SaAB


Accueil </div></div>

Cette catégorie ne contient actuellement aucune page ni fichier multimédia.

Génotoul BioInfo
Équipe RECORD
IMABS
Outils personnels