Fouille de graphes pour la découverte de contrastes entre classes : application à l'estimation de la toxicité des molécules - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2011

Graph data mining to discover contrasts between classes : application to predictive (eco)toxicology

Fouille de graphes pour la découverte de contrastes entre classes : application à l'estimation de la toxicité des molécules

Résumé

This thesis deals with graph mining and proposes methods to discover contrasts between classes and applications to predictive (eco)toxicology.We present a new kind of patterns, the emerging graphs patterns - graphs conjunctions whose presence is linked to a given classification - in order to capture contrasts between classes embedded in graph data. Our method is based on a change of graphs description allowing to come back to a tabular data mining context. The broad of data mining constraints can then be applied and we especially use the emerging constraint.We also show how to extend to the graphs the condensed representation of graph patterns according to the emerging constraint. We use closed patterns and the inclusion relation between graphs to respectively reduce the number and average size of the extracted patterns. This method summarizes graph patterns and make easier their exploration and uses. The thread of this research is about the assessment of the molecular (eco)toxicological properties using in silico models, following the Registration, Evaluation, Autorisation and Restriction of Chemicals European standard. In this context, the graph data mining methods allow to automatically extract sets of toxicophores (i. e. molecular fragments that can influence the chemical toxic behavior) from the examples given in a chemical library. An experimental series shows the appearance of new fragments when the chemical toxicity level increases. Those research contribute to the acquisition of a new knowledge on chemicals toxicity mechanisms completing human' s expertise on that field.
Cette thèse porte sur la fouille de graphes et propose un ensemble de méthodes pour la découverte de contrastes entre classes et leurs contributions à des problématiques de prédictions de propriétés (éco)toxicologiques de composés chimiques. Nous présentons un nouveau type de motifs, les motifs émergents de graphes - les conjonctions de graphes dont la présence est liée à la classification donnée en entrée - afin de cibler l'information caractérisant les différentes lasses. Notre méthode repose sur un changement de description des graphes permettant de revenir à un contexte de fouille de données tabulaires. L'étendue des contraintes utilisées en fouille de données tabulaires peut ainsi être exploitée, telle que la contrainte d'émergence. Nous montrons également qu'il est possible d'étendre aux motifs de graphes les représentations condensées de motifs sur la contrainte d'émergence. Cette méthode synthétise les motifs de graphes et facilite leur exploration et leur usages. Le fil conducteur de ce travail est celui de l'évaluation de propriétés (éco)toxicologiques de molécules par l'usage de modèles in silico, conformément à la norme européenne REACH. Dans ce contexte, les méthodes de fouille de graphes proposées permettent d'extraire des toxicophores (i.e. des fragments de molécules qui peuvent influencer le comportement toxique des molécules) à partir des exemples d'une chimiothèque. Une série expérimentale montre l'apparition de nouvelles structures lorsque le niveau de toxicité des molécules augmente. Ces travaux contribuent à l'acquisition de nouvelles connaissances sur les mécanismes de toxicité des molécules venant compléter les connaissances expertes humaines.
Fichier principal
Vignette du fichier
These-Guillaume-Poezevara-2011.pdf (2.49 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01018425 , version 1 (04-07-2014)

Identifiants

  • HAL Id : tel-01018425 , version 1

Citer

Guillaume Poezevara. Fouille de graphes pour la découverte de contrastes entre classes : application à l'estimation de la toxicité des molécules. Intelligence artificielle [cs.AI]. Université de Caen, 2011. Français. ⟨NNT : ⟩. ⟨tel-01018425⟩
349 Consultations
140 Téléchargements

Partager

Gmail Facebook X LinkedIn More