Construction et utilisation d'une base de connaissances pharmacogénomique pour l'intégration de données et la découverte de connaissances

Adrien Coulet 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Cette thèse porte sur l'utilisation d'ontologies et de bases de connaissances pour guider différentes étapes du processus d'Extraction de Connaissances à partir de Bases de Données (ECBD) et sur une application en pharmacogénomique. Les données relatives à ce domaine sont hétérogènes, complexes, et distribuées dans diverses bases de données, ce qui rend cruciale l'étape préliminaire de préparation et d'intégration des données à fouiller. Je propose pour guider cette étape une approche originale d'intégration de données qui s'appuie sur une représentation des connaissances du domaine sous forme de deux ontologies en logiques de description : SNP-Ontology et SO-Pharm. Cette approche a été implémentée grâce aux technologies du Web sémantique et conduit au peuplement d'une base de connaissances pharmacogénomique. Le fait que les données à fouiller soient alors disponibles dans une base de connaissances entraîne de nouvelles potentialités pour le processus d'extraction de connaissances. Je me suis d'abord intéressé au problème de la sélection des données les plus pertinentes à fouiller en montrant comment la base de connaissances peut être exploitée dans ce but. Ensuite j'ai décrit et appliqué à la pharmacogénomique, une méthode qui permet l'extraction de connaissances directement à partir d'une base de connaissances. Cette méthode appelée Analyse des Assertions de Rôles (ou AAR) permet d'utiliser des algorithmes de fouille de données sur un ensemble d'assertions de la base de connaissances pharmacogénomique et d'expliciter des connaissances nouvelles et pertinentes qui y étaient enfouies.
Type de document :
Thèse
Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy 1, 2008. Français. 〈NNT : 2008NAN10047〉
Liste complète des métadonnées

Littérature citée [169 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01748450
Contributeur : Adrien Coulet <>
Soumis le : lundi 20 octobre 2008 - 20:43:11
Dernière modification le : samedi 19 mai 2018 - 01:26:42
Document(s) archivé(s) le : mardi 9 octobre 2012 - 14:05:10

Identifiants

  • HAL Id : tel-01748450, version 2

Collections

Citation

Adrien Coulet. Construction et utilisation d'une base de connaissances pharmacogénomique pour l'intégration de données et la découverte de connaissances. Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy 1, 2008. Français. 〈NNT : 2008NAN10047〉. 〈tel-01748450v2〉

Partager

Métriques

Consultations de la notice

1197

Téléchargements de fichiers

4869