Page d'accueil previous up next contents
Page suivante: 4.1.2 Visualisation de structures secondaires Niveau précédent: 4.1 Détermination et visualisation de Page précédente: 4.1 Détermination et visualisation de


4.1.1 Détermination de structures secondaires d'ARN

Le problème de la détermination d'une structure secondaire se traite différemment selon que l'on dispose d'une seule séquence (une molécule d'ARN d'un organisme) ou de plusieurs séquences homologues (un ensemble de molécules d'ARN de même fonction mais appartenant à des organismes différents). Nous considérons ici le cas où une seule séquence est disponible. Un inconvénient majeur des approches traditionnelles est la difficulté à prendre en compte les contraintes de repliement issues de données expérimentales (imposer un appariement, un non-appariement...) autoriser localement la présence de pseudo-nud (cf. infra)... L'intérêt de l'approche proposée dans [ Gas 94] est double : permettre à l'utilisateur de spécifier pas à pas une structure hypothétique par adjonction/retrait de contraintes structurales ; générer l'ensemble des structures secondaires satisfaisant les contraintes.

Le problème est formulé dans le cadre CSP de la manière suivante :

variables :
à chaque base (i désigne le numéro d'ordre de la base dans la séquence de longueur N) est associée une variable ;
valeurs :
chaque variable prend ses valeurs dans l'intervalle d'entiers , chaque valeur j de ce domaine représentant un partenaire possible de dans une structure secondaire ; les bases n'étant pas toutes appariées dans une structure secondaire, la valeur i dans le domaine de représente le fait que la base n'est pas appariée dans la structure solution ;
contraintes :
les contraintes énoncées sont les contraintes classiques de repliement en structure secondaire :

Une fois le problème posé, le nombre de solutions satisfaisant les contraintes reste de l'ordre de (N représente la taille de la séquence). Les auteurs ont ajouté quelques contraintes supplémentaires qui permettent de réduire considérablement l'espace de recherche en faisant varier la taille minimum des hélices et en prenant en compte la stabilité de la molécule (sous forme de probabilités d'appariement) et les données expérimentales. Dans une première étape, dite de spécification, le maintien d'arc cohérence est recherché.

Une fois les propriétés de la structure secondaire spécifiées, un algorithme de recherche de cliques maximales travaille sur un sous-graphe de la micro-structuregif du réseau de contraintes pour produire l'ensemble des structures secondaires saturées (maximales au sens de l'inclusion sur les ensembles d'appariements) satisfaisant l'ensemble des contraintes.

Page d'accueil previous up next contents
Page suivante: 4.1.2 Visualisation de structures secondaires Niveau précédent: 4.1 Détermination et visualisation de Page précédente: 4.1 Détermination et visualisation de




Auteurs:Christine Gaspin, Christian Bessiere, Annick Moisan et Thomas Schiex

Dernière mise à jour: jeudi, 11 janvier 1996, 18:28:04 MET

Institut National de la Recherche Agronomique
Département de Biométrie et Intelligence Artificielle

Copyright(C)1995
INRA
Tous droits réservés