Personnalisation et enrichissement des méthodes d’accès aux données

Grégory Smits 1
1 SHAMAN - Symbolic and Human-centric view of dAta MANagement
IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
Résumé : La transformation de données en connaissances constitue une tâche cruciale au cœur de nombreuses activités professionnelles. Deux principales stratégies peuvent être envisagées pour effectuer cette transformation : l’interaction par requêtage avec un système de gestion de bases de données ou l’application de méthodes souvent automatiques de fouille de données. Ces deux approches ont jusqu’alors été étudiées de manière indépendante par deux communautés scientifiques distinctes : celle des bases de données et celle de la fouille de données. Les travaux décrits dans ce document, dont un objectif est d’effectuer une synthèse constructive des résultats obtenus au cours de mes huit années de recherche à l’IRISA, s’inscrivent principalement dans le cadre de l’interrogation de bases de données. Cependant, de par l’importance grandissante prise par les données non tructurées, mes dernières contributions établissent une intersection entre l’acquisition automatique non supervisée de connaissances et l’interrogation de données. Le fil conducteur de ce document est l’enrichissement des méthodes d’accès aux données. L’accès aux données y est vu comme un processus en trois étapes, 1) l’expression d’un besoin d’information, 2) la récupération efficace des données satisfaisant le besoin d’information exprimé et 3) la restitution des résultats à l’utilisateur. Le trait singulier de la chaîne de traitement de données décrite dans ce document provient de la place prépondérante accordée à l’utilisateur à chaque étape du processus de transformation des données en connaissances. La première partie de ce document est consacrée à l’enrichissement des méthodes d’accès aux données. Mes contributions sur l’enrichissement de l’étape d’expression des besoins d’information s’articulent autour de deux axes. Le premier consiste à rendre flexibles les interfaces d’interrogation et à améliorer leur expressivité en permettant à l’utilisateur d’accéder aux données à travers l’utilisation d’un vocabulaire personnel composé de descripteurs linguistiques. Le second axe consiste à assister l’utilisateur, avec des stratégies coopératives ou des interfaces d’interrogation intuitives, lors de la traduction de son besoin d’information en requête. Les systèmes commerciaux de gestion de données n’étant pas initialement pourvus de fonctionnalités d’interrogation flexible à l’aide de descripteurs linguistiques, la seconde partie du document décrit mes contributions sur l’évaluation de conditions de sélection de données exprimées à l’aide de descripteurs linguistiques subjectifs. Ces travaux m’ont permis de montrer qu’il était possible de trouver un compromis intéressant entre flexibilité et efficacité lors de l’interrogation de données. Un système intelligent d’accès aux données se doit d’accompagner l’utilisateur lors de l’analyse des résultats de sa requête. Les stratégies de réponse coopérative visent à aider l’utilisateur à comprendre un ensemble de résultats et à l’enrichir avec des données ou connaissances complémentaires. La troisième partie de ce document détaille plusieurs stratégies coopératives permettant à l’utilisateur de transformer plus rapidement les résultats de ses requêtes en connaissances. Le cadre théorique qui unifie les maillons de la chaîne de traitement de données présentée dans ce document est celui du soft computing. Ce document a également pour objectif de montrer que les théories et techniques de soft computing apportent des solutions pragmatiques et novatrices à un enjeu actuel crucial, celui de la valorisation des données. Le bilan, dressé sous forme de perspectives de recherche à la fin de ce document, souligne le rôle majeur que peut jouer la communauté scientifique du soft computing en promouvant l’idée de représenter, calculer et raisonner sur des données avec des mots.
Type de document :
HDR
Base de données [cs.DB]. Université Rennes 1, 2018
Liste complète des métadonnées

Littérature citée [226 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01739707
Contributeur : Grégory Smits <>
Soumis le : mercredi 21 mars 2018 - 12:01:34
Dernière modification le : mercredi 16 mai 2018 - 11:24:08

Fichier

main.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01739707, version 1

Citation

Grégory Smits. Personnalisation et enrichissement des méthodes d’accès aux données. Base de données [cs.DB]. Université Rennes 1, 2018. 〈tel-01739707〉

Partager

Métriques

Consultations de la notice

309

Téléchargements de fichiers

183