Scalable Saturation of Streaming RDF Triples - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2021

Scalable Saturation of Streaming RDF Triples

La saturation extensible du streaming RDF triple

Résumé

In the Big Data era, RDF data are producing in high volumes. While there exist proposals for reasoning over large RDF graphs using big data platforms, there is a deficiency of solutions that do so in environments where RDF data are dynamic, and where new instance and schema triples can arrive at any time.In this thesis, we present the first solution for reasoning over large streams of RDF data using big data platforms. In doing so, we focus on the saturation operation, which seeks to infer implicit RDF triples given RDF schema constraints.Indeed, unlike existing solutions which saturate RDF data in bulk, our solution carefully identifies the fragment of the existing (and already saturated) RDF dataset that needs to be considered given the fresh RDF statements delivered by the stream. Thereby, it performs the saturation in an incremental manner. Experimental analysis shows that our solution outperforms existing bulk-based saturation solutions.
À l'ère des Big Data, les données RDF sont produites en grand nombre. Bien qu'il existe des propositions de raisonnement sur de grands graphiques RDF utilisant de grandes plateformes de données, il y a un manque de solutions qui le font dans des environnements où les données RDF sont dynamiques, et où de nouvelles instances et de nouveaux triplets de schéma peuvent arriver à tout moment. Dans cette thèse, nous présentons la première solution pour raisonner sur de grands flux de données RDF en utilisant de grandes plateformes de données. Ce faisant, nous nous concentrons sur l'opération de saturation, qui cherche à déduire des triples RDF implicites étant donné les contraintes du schéma RDF. En effet, contrairement aux solutions existantes qui saturent les données RDF en masse, notre solution identifie soigneusement le fragment de l'ensemble de données RDF existant (et déjà saturé) qui doit être pris en compte étant donné les nouvelles déclarations RDF délivrées par le flux. Ainsi, elle effectue la saturation de manière incrémentielle. L'analyse expérimentale montre que notre solution est plus performante que les solutions de saturation en masse existantes.
Fichier principal
Vignette du fichier
2021UPSLD019.pdf (2.37 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03580501 , version 1 (18-02-2022)

Identifiants

  • HAL Id : tel-03580501 , version 1

Citer

Mohammad Amin Farvardin. Scalable Saturation of Streaming RDF Triples. Document and Text Processing. Université Paris sciences et lettres, 2021. English. ⟨NNT : 2021UPSLD019⟩. ⟨tel-03580501⟩
57 Consultations
81 Téléchargements

Partager

Gmail Facebook X LinkedIn More