Prédiction de gènes d'ARN dans les séquences génomiques

  • Soutenue le : 15/06/2009
  • Directeur de thèse : Christine Gaspin
  • Co-directeurs : Christine Cierco-Ayrolles et Christian Boucher (Laboratoire des Interactions plantes-microorganismes, INRA, Toulouse)
  • Ecole doctorale : Sciences Ecologiques, Vétérinaires, Agronomiques, Bioingénieries (Toulouse III)
  • Mots-clés : Noncoding RNA detection, Generalised Liner Models, Staphylococcus aureus, HMM, Ralstonia solanacearum, Viterbi training, Compositional bias
  • Manuscrit : Manuscrit (français)

Résumé : Les ARN non-codant sont des régulateurs clés des divers processus cellulaires, chez les procaryotes et les eucaryotes. Malgré le grand nombre des ARN non-codant connus à ce jour il n’existe pas de méthode bioinformatique universelle permettant leur détection. Il est connu que, dans les genomes archéans A+T riches hyperthermophiles, la détection est possible à l’aide de leur composition en G+C elevée dans ces génomes. Ici nous étudions l’approche par biais de composition pour la détection des ARN non-codant dans le génome G+C riche de Ralstonia solanacearum pour lequel aucun étude de recherche des ARNnc n’a pas été menée à ce jour. Nous étudions tout d’abord l’existence d’un biais de composition dans les ARNnc du génome A+T riche de Staphylococcus aureus. D’un point de vue méthodologique, ce travail propose une procédure pour tester l’existence d’un biais en G+C dans différents éléments génomiques. La procédure est basée sur la theorie des Modeles Lineaires Generalises. Nous montrons que les ARNnc de S. Aureus ensemble avec certaines séquences repetées, sont caracterisées par le G+C% plus elevée et ceci peut être utilisé pour leur détection. La même approche à été utilisée avec moins de succès sur le génome de R. Somanacearum. De façon complémentaire a l’approche par biais de composition, nous avons utilise l’analyse comparative des différentes souches de R. Solanacearum pour la détection des ARNnc conserves. Nous avons développe la nouvelle version de RNAsim, un outil utilisant la théorie des graphes pour identifier les régions intergeniques conservées entre plusieurs génomes. Les candidats choisis a l’aide de l’approche comparative ont été analyses par rapport a la conservation de leur structure secondaire, éléments de syntenie etc. Afin d’évaluer leur pertinence biologique. Huit candidats ont été sélectionnes et ils seront testes biologiquement.


Avatar
Ana KOZOMARA