Représentation et gestion des connaissances dans un processus d'Extraction de Connaissances à partir de Données multi-points de vue - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2013

Knowledge Management in Multi-view KDD Process

Représentation et gestion des connaissances dans un processus d'Extraction de Connaissances à partir de Données multi-points de vue

Résumé

In recent decades, enterprises' information systems become more and more flooded by all kind of data: structured (databases, data warehouse), semi-structured (XML, server log files), and unstructured data (raw text, multimedia data). This has created new challenges for companies and for the scientific community. Including, how to understand and analyze such a mass of data to extract knowledge. Moreover, in an organization, a data mining project is usually conducted by several experts (domain experts, KDD experts, data experts...) who consequently manipulate several types of knowledge and know-how. They will have different objectives and preferences, different competences, and different visions of analyzed data and of KDD methods. Our objective in this thesis is to facilitate the KDD analyst task, and to improve coordination and comprehensibility between the different actors in a multi-view analysis as well as the reuse of KDD process in terms of viewpoints. Therefore, we propose a definition that makes explicit the notion of viewpoint in KDD and includes domain knowledge (analyzed domain and analyst domain) and context of analysis. Based on this definition, we propose the development of a set of semantic models that are structured in a Conceptual Model and allowing knowledge representation and management during a multi-view analysis. Our approach is based on a multi-criteria characterization of viewpoint in KDD. A characterization that is primarily designed to capture the objectives and context of analysis of the expert, guide the construction and execution of the KDD process, and then keep the trace, in the form of annotations, of reasoning made during a collaborative work. These annotations can be shared, compared and reused based on a set of semantic relations between viewpoints.
Les systèmes d'information des entreprises actuelles sont de plus en plus " submergés " par des données de tous types : structurées (bases de données, entrepôts de données), semi-structurées (documents XML, fichiers log) et non structurées (textes et multimédia). Ceci a créé de nouveaux défis pour les entreprises et pour la communauté scientifique, parmi lesquels comment comprendre et analyser de telles masses de données afin d'en extraire des connaissances. Par ailleurs, dans une organisation, un projet d'Extraction de Connaissances à partir de Données (ECD) est le plus souvent mené par plusieurs experts (experts de domaine, experts d'ECD, experts de données...), chacun ayant ses préférences, son domaine de compétence, ses objectifs et sa propre vision des données et des méthodes de l'ECD. C'est ce que nous qualifions de processus d'ECD multi-vues (ou processus multi-points de vue). Notre objectif dans cette thèse est de faciliter la tâche de l'analyste d'ECD et d'améliorer la coordination et la compréhensibilité entre les différents acteurs d'une analyse multi-vues, ainsi que la réutilisation du processus d'ECD en termes de points de vue. Aussi, nous proposons une définition qui rend explicite la notion de point de vue en ECD et qui tient compte des connaissances de domaine (domaine analysé et domaine de l'analyste) et du contexte d'analyse. A partir de cette définition, nous proposons le développement d'un ensemble de modèles sémantiques, structurés dans un Modèle Conceptuel, permettant la représentation et la gestion des connaissances mises en œuvre lors d'une analyse multi-vues. Notre approche repose sur une caractérisation multi-critères du point de vue en ECD. Une caractérisation qui vise d'abord à capturer les objectifs et le contexte d'analyse de l'expert, puis orienter l'exécution du processus d'ECD, et par la suite garder, sous forme d'annotations, la trace du raisonnement effectué pendant un travail multi-experts. Ces annotations sont partagées, comparées et réutilisées à l'aide d'un ensemble de relations sémantiques entre points de vue.
Fichier principal
Vignette du fichier
Memoire_These_zemmouri.pdf (4.24 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00940780 , version 1 (02-02-2014)

Identifiants

  • HAL Id : tel-00940780 , version 1

Citer

El Moukhtar Zemmouri. Représentation et gestion des connaissances dans un processus d'Extraction de Connaissances à partir de Données multi-points de vue. Apprentissage [cs.LG]. Ecole Nationale Supérieure d'Arts et Métiers - Meknès, 2013. Français. ⟨NNT : ⟩. ⟨tel-00940780⟩

Collections

TDS-MACS
429 Consultations
1486 Téléchargements

Partager

Gmail Facebook X LinkedIn More