Efficient Querying and Analytics of Semantic Web Data

Alexandra Roatis 1, 2
2 OAK - Database optimizations and architectures for complex large data
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Résumé : L'utilité et la pertinence des données se trouvent dans l'information qui peut en être extraite.Le taux élevé de publication des données et leur complexité accrue, par exemple dans le cas des données du Web sémantique autodescriptives et hétérogènes, motivent l'intérêt de techniques efficaces pour la manipulation de données.Dans cette thèse, nous utilisons la technologie mature de gestion de données relationnelles pour l'interrogation des données du Web sémantique.La première partie se concentre sur l'apport de réponse aux requêtes sur les données soumises à des contraintes RDFS, stockées dans un système de gestion de données relationnelles. L'information implicite, résultant du raisonnement RDF est nécessaire pour répondre correctement à ces requêtes.Nous introduisons le fragment des bases de données RDF, allant au-delà de l'expressivité des fragments étudiés précédemment.Nous élaborons de nouvelles techniques pour répondre aux requêtes dans ce fragment, en étendant deux approches connues de manipulation de données sémantiques RDF, notamment par saturation de graphes et reformulation de requêtes.En particulier, nous considérons les mises à jour de graphe au sein de chaque approche et proposerons un procédé incrémental de maintenance de saturation. Nous étudions expérimentalement les performances de nos techniques, pouvant être déployées au-dessus de tout moteur de gestion de données relationnelles.La deuxième partie de cette thèse considère les nouvelles exigences pour les outils et méthodes d'analyse de données, issues de l'évolution du Web sémantique.Nous revisitons intégralement les concepts et les outils pour l'analyse de données, dans le contexte de RDF.Nous proposons le premier cadre formel pour l'analyse d'entrepôts RDF. Notamment, nous définissons des schémas analytiques adaptés aux graphes RDF hétérogènes à sémantique riche, des requêtes analytiques qui (au-delà de cubes relationnels) permettent l'interrogation flexible des données et schémas, ainsi que des opérations d'agrégation puissantes de type OLAP. Des expériences sur une plateforme entièrement implémentée démontrent l'intérêt pratique de notre approche.
Type de document :
Thèse
Databases [cs.DB]. Université Paris Sud - Paris XI, 2014. English. 〈NNT : 2014PA112218〉
Liste complète des métadonnées

Littérature citée [15 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01082065
Contributeur : Abes Star <>
Soumis le : mercredi 26 novembre 2014 - 10:39:50
Dernière modification le : lundi 28 mai 2018 - 14:38:02
Document(s) archivé(s) le : vendredi 27 février 2015 - 11:00:42

Fichiers

VD2_ROATIS_ALEXANDRA_22092014....
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01082065, version 1

Collections

Citation

Alexandra Roatis. Efficient Querying and Analytics of Semantic Web Data. Databases [cs.DB]. Université Paris Sud - Paris XI, 2014. English. 〈NNT : 2014PA112218〉. 〈tel-01082065〉

Partager

Métriques

Consultations de la notice

709

Téléchargements de fichiers

1236