Skip to Main content Skip to Navigation
Theses

Discovering and exploiting analogical proportions in a relational database context

Résumé : Dans cette thèse, nous nous intéressons aux proportions analogiques dans le contexte des bases de données relationnelles. Les proportions analogiques permettent de lier quatre éléments dans une relation du type ''A est à B ce que C est à D''. Par exemple, « Paris est à la France ce que Rome est à l'Italie ». Nous avons étudié le problème de la prédiction de valeurs manquantes dans une base de données en utilisant les proportions analogiques. Un algorithme de classification fondé sur les proportions analogiques a été modifié afin de résoudre ce problème. Puis, nous avons étudié les propriétés des éléments appartenant à l'ensemble d'apprentissage des classificateurs analogiques fréquemment exploités pour calculer la prédiction. Ceci nous a permis de réduire considérablement la taille de cet ensemble par élimination des éléments peu pertinents et par conséquent, de diminuer les temps d'exécution de ces classificateurs. La deuxième partie de la thèse a pour objectif de découvrir de nouveaux patrons basés sur la relation d'analogie, i.e., des parallèles, dans les bases de données. Nous avons montré qu'il est possible d'extraire ces patrons en s'appuyant sur des approches de clustering. Les clusters produits par de telles techniques présentent aussi un intérêt pour l'évaluation de requêtes recherchant des patrons d'analogie dans les bases de données. Dans cette perspective, nous avons proposé d'étendre le langage de requêtes SQL pour pouvoir trouver des quadruplets d'une base de données satisfaisant une proportion analogique. Nous avons proposé différentes stratégies d'évaluation pour de telles requêtes, et avons comparé expérimentalementleurs performances.
Document type :
Theses
Complete list of metadatas

Cited literature [105 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01508503
Contributor : Abes Star :  Contact
Submitted on : Friday, April 14, 2017 - 11:48:10 AM
Last modification on : Wednesday, June 24, 2020 - 4:19:44 PM
Document(s) archivé(s) le : Saturday, July 15, 2017 - 1:09:41 PM

File

CORREA_William.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01508503, version 1

Citation

William Correa Beltran. Discovering and exploiting analogical proportions in a relational database context. Databases [cs.DB]. Université Rennes 1, 2016. English. ⟨NNT : 2016REN1S110⟩. ⟨tel-01508503⟩

Share

Metrics

Record views

360

Files downloads

285