Discovering and exploiting analogical proportions in a relational database context

Résumé : Dans cette thèse, nous nous intéressons aux proportions analogiques dans le contexte des bases de données relationnelles. Les proportions analogiques permettent de lier quatre éléments dans une relation du type ''A est à B ce que C est à D''. Par exemple, « Paris est à la France ce que Rome est à l'Italie ». Nous avons étudié le problème de la prédiction de valeurs manquantes dans une base de données en utilisant les proportions analogiques. Un algorithme de classification fondé sur les proportions analogiques a été modifié afin de résoudre ce problème. Puis, nous avons étudié les propriétés des éléments appartenant à l'ensemble d'apprentissage des classificateurs analogiques fréquemment exploités pour calculer la prédiction. Ceci nous a permis de réduire considérablement la taille de cet ensemble par élimination des éléments peu pertinents et par conséquent, de diminuer les temps d'exécution de ces classificateurs. La deuxième partie de la thèse a pour objectif de découvrir de nouveaux patrons basés sur la relation d'analogie, i.e., des parallèles, dans les bases de données. Nous avons montré qu'il est possible d'extraire ces patrons en s'appuyant sur des approches de clustering. Les clusters produits par de telles techniques présentent aussi un intérêt pour l'évaluation de requêtes recherchant des patrons d'analogie dans les bases de données. Dans cette perspective, nous avons proposé d'étendre le langage de requêtes SQL pour pouvoir trouver des quadruplets d'une base de données satisfaisant une proportion analogique. Nous avons proposé différentes stratégies d'évaluation pour de telles requêtes, et avons comparé expérimentalementleurs performances.
Type de document :
Thèse
Databases [cs.DB]. Université Rennes 1, 2016. English. 〈NNT : 2016REN1S110〉
Liste complète des métadonnées

Littérature citée [129 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01508503
Contributeur : Abes Star <>
Soumis le : vendredi 14 avril 2017 - 11:48:10
Dernière modification le : lundi 16 octobre 2017 - 12:01:25
Document(s) archivé(s) le : samedi 15 juillet 2017 - 13:09:41

Fichier

CORREA_William.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01508503, version 1

Collections

Citation

William Correa Beltran. Discovering and exploiting analogical proportions in a relational database context. Databases [cs.DB]. Université Rennes 1, 2016. English. 〈NNT : 2016REN1S110〉. 〈tel-01508503〉

Partager

Métriques

Consultations de la notice

167

Téléchargements de fichiers

48