Castor : a constraint-based SPARQL engine with active filter processing

Résumé : SPARQL est le langage de requête standard pour les graphes de données du Web Sémantique. L’évaluation de requêtes est étroitement liée aux problèmes d’appariement de graphes. Il a été démontré que l’évaluation est NP-difficile. Les moteurs SPARQLde l’état-de-l’art résolvent les requêtes SPARQL en utilisant des techniques de bases de données traditionnelles. Cette approche est efficace pour les requêtes simples qui fournissent un point de départ précis dans le graphe. Par contre, les requêtes couvrant tout le graphe et impliquant des conditions de filtrage complexes ne passent pas bien à l’échelle. Dans cette thèse, nous proposons de résoudre les requêtes SPARQL en utilisant la Programmation par Contraintes (CP). La CP résout un problème combinatoire enexploitant les contraintes du problème pour élaguer l’arbre de recherche quand elle cherche des solutions. Cette technique s’est montrée efficace pour les problèmes d’appariement de graphes. Nous reformulons la sémantique de SPARQL en termes deproblèmes de satisfaction de contraintes (CSPs). Nous appuyant sur cette sémantique dénotationnelle, nous proposons une sémantique opérationnelle qui peut être utilisée pour résoudre des requêtes SPARQL avec des solveurs CP génériques.Les solveurs CP génériques ne sont cependant pas conçus pour traiter les domaines immenses qui proviennent des base de données du Web Sémantique. Afin de mieux traiter ces masses de données, nous introduisons Castor, un nouveau moteurSPARQL incorporant un solveur CP léger et spécialisé. Nous avons apporté une attention particulière à éviter tant que possible les structures de données et algorithmes dont la complexité temporelle ou spatiale est proportionnelle à la taille de la base dedonnées. Des évaluations expérimentales sur des jeux d’essai connus ont montré la faisabilité et l’efficacité de l’approche. Castor est compétitif avec des moteurs SPARQL de l’état-de-l’art sur des requêtes simples, et les surpasse sur des requête.
Type de document :
Thèse
Databases [cs.DB]. Université Claude Bernard - Lyon I, 2013. English. <NNT : 2013LYO10275>
Liste complète des métadonnées


https://tel.archives-ouvertes.fr/tel-01127937
Contributeur : Abes Star <>
Soumis le : lundi 9 mars 2015 - 06:04:49
Dernière modification le : jeudi 17 novembre 2016 - 05:06:21
Document(s) archivé(s) le : mercredi 10 juin 2015 - 11:35:23

Fichier

2013LYO10275.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01127937, version 1

Collections

Citation

Vianney Le Clement de Saint-Marcq. Castor : a constraint-based SPARQL engine with active filter processing. Databases [cs.DB]. Université Claude Bernard - Lyon I, 2013. English. <NNT : 2013LYO10275>. <tel-01127937>

Partager

Métriques

Consultations de
la notice

117

Téléchargements du document

154