Page d'accueil previous up next contents
Page suivante: Nature des requêtes : Niveau précédent: 6 Conclusion Page précédente: 6 Conclusion


Nature des données :

elles sont généralement obtenues suite à une série d'expériences dont le but est d'accumuler, au moindre effort et le plus rapidement possible, suffisamment d'informations sur un objet afin de déterminer de manière non ambiguë ses caractéristiques. Ces données sont souvent d'origine disparate et de nature incomplète, incertaine et imprécise.

L'incomplétude peut être liée à la lourdeur des expériences à réaliser (ex : mise en évidence du caractère apparié ou non d'une base dans un ARN) ou à l'absence d'outil d'investigation de certains objets biologiques. Le caractère incomplet des données confère généralement au problème mathématique associé un caractère sous-contraint, cela ayant souvent pour conséquence la production d'un très grand nombre de solutions.

La réponse traditionnelle à cette surabondance de solutions consiste à énoncer un ensemble de règles << empiriques >> ou des hypothèses qui permettront de convenablement sélectionner un sous-ensemble pertinent des solutions ou bien à définir un critère de qualité des solutions et à traiter le problème comme un problème d'optimisation dans lequel on s'intéressera aux k meilleures solutions. La validité de la méthode de sélection étant hypothétique, une des tendances actuelles consiste à laisser au biologiste un rôle actif dans la recherche de solutions en lui permettant d'incorporer ses propres hypothèses sous formes de contraintes qu'il pourra éventuellement supprimer par la suite, ou que le système pourra relâcher si nécessaire.

Les caractères imprécis et incertain trouvent leur origine dans le type même des expériences réalisées pour obtenir des données : il s'agit de mesures physico-chimiques ayant en général un taux d'erreur non négligeable et à partir desquelles il est impossible d'obtenir une information précise de façon certaine. De ce fait, plusieurs types d'expériences sont souvent réalisées pour réunir un ensemble d'informations convergent. La disparité des sources d'information, les biais expérimentaux sont source d'erreurs et donc de conflits. Les règles empiriques qui peuvent en découler peuvent être complètement remises en cause lorsque les techniques d'investigation de l'objet biologique évoluent.

C'est donc sur un ensemble de données de nature disparate et de qualité inégale que le biologiste devra s'appuyer pour construire un faisceau d'évidences lui permettant de mieux caractériser l'objet biologique étudié. Généralement, le biologiste procède pas à pas, alternant calculs mathématiques/informatiques et expériences biologiques. En effet, les modèles mathématiques sont souvent utilisés pour mieux cerner l'objet biologique avant de suggérer des expériences permettant d'obtenir des données plus précises.

Face à ces données de nature variée, la force essentielle du cadre CSP réside dans sa grande généralité d'expression : aucune limitation quant à la nature des contraintes (linéaires ou non par exemple). Il devient ainsi possible d'exprimer dans un même formalisme, et sans distorsion abusive, des données d'origine variée. Cet enthousiasme pour les CSP peut être modéré par deux limitations relatives : la mauvaise prise en compte de contraintes de forte arité (l'essentiel des techniques de base ont été formulées dans le cadre CSP binaire, limité à des contraintes portant sur deux variables) et la difficulté de représenter simplement et naturellement des données de nature continue. Cependant, de nombreux remèdes sont disponibles dès lors que l'on est prêt à sortir du cadre CSP pur : développement de techniques de filtrage ad-hoc, coopération ou intégration au cadre CSP d'autres types de résolveurs (propagation d'intervalles...).

Diverses extensions du cadre CSP classique qui ont été proposées ces dernières années semblent plus particulièrement pertinentes dans le cadre des problèmes qui nous intéressent :

CSP dynamiques
: les techniques développées dans ce cadre sont des techniques incrémentales (`` on-line'') pour l'ajout et le retrait de contraintes. Elles sont donc particulièrement adaptées pour la construction d'outils interactifs de résolution pour le biologiste qui peut à son gré retirer ou ajouter des propriétés ``hypothétiques'' (ou dont la validité est incertaine) sur son objet d'étude pendant que le système s'assure en permanence de l'absence d'incohérence (locale ou non).
CSP flous ou valués
: si le modèle CSP permet naturellement une modélisation naïve de l'imprécision par relaxation des domaines et/ou contraintes (menant encore une fois à un nombre de solutions excessif), le traitement d'imprécisions graduelles est naturel dans une extension du type CSP flous puisqu'il permet l'expression de valeurs ou de combinaisons de valeurs graduellement satisfaisantes.

Ces deux types d'extensions sont décrits plus précisément dans différents articles de ce volume auxquels nous renvoyons le lecteur intéressé.

Pour finir, il est intéressant de noter que certains types de contraintes apparaissent de façon répétée dans les problèmes que nous avons considérés. Les problèmes de cartographie, qu'ils soient génétiques ou physiques, concernent un objet uni-dimensionnel, orienté, similaire à l'axe temporel (avec cependant un caractère discret et l'existence de deux axes opposés et complémentaires qui n'existent pas pour le temps) : les techniques de raisonnement temporel fournissent une première base à d'éventuels développements dans le domaine [ Sch 95].

Les problèmes de détermination de structure tertiaire sont essentiellement de nature géométrique, mais les contraintes géométriques ont jusqu'à présent reçu très peu d'intérêt de la part de la communauté travaillant sur les problèmes de satisfaction de contraintes.

Page d'accueil previous up next contents
Page suivante: Nature des requêtes : Niveau précédent: 6 Conclusion Page précédente: 6 Conclusion




Auteurs:Christine Gaspin, Christian Bessiere, Annick Moisan et Thomas Schiex

Dernière mise à jour: jeudi, 11 janvier 1996, 18:28:04 MET

Institut National de la Recherche Agronomique
Département de Biométrie et Intelligence Artificielle

Copyright(C)1995
INRA
Tous droits réservés