Synchronous relations and complexity of query evaluation - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Synchronous relations and complexity of query evaluation

Relations synchronisées et complexité de l'évaluation des requêtes

Résumé

Synchronous relations are relations on words defined by finite automata with synchronous movement of heads. They are considered to be a natural higher-dimensional extension of regular languages. They have robust theoretical properties, and are expressive enough to find applications in a wide variety of domains. One such domain is graph databases, where the querying formalism of Regular Path Queries is extended with conjunctions and synchronous relations to produce Extended Conjunctive Regular Path Queries (ECRPQs). These queries, when evaluated on databases, output vertices with paths whose labels correspond to a given synchronous relation.We study the logical characterization of synchronous relations, building upon a theorem of Eilenberg et al. which states that the set of relations definable by formulae in the first order theory of words with the prefix, equal length and last letter predicates, is precisely the set of synchronous relations. We study the quantifier alternation hierarchy of this logic, showing that it collapses in expressive power at the third level. Furthermore we characterize the lower levels of this hierarchy - levels one and two and their Boolean closures - providing a combinatorial description of the relational subclasses corresponding to the lower levels of this hierarchy. An important problem in this context is membership; for a given subset C of synchronous relations, the C-membership problem asks if an input synchronous relation belongs in C or not. We show that C-membership is decidable for all subclasses C of relations definable in the lower levels of the quantifier alternation hierarchy.We also study the query evaluation problem for ECRPQs, which is known to be PSpace-complete. A common theme of research in the evaluation of Conjunctive Queries, RPQs and their variants, is to consider subclasses of queries which are easy to evaluate. In other words we want to specify the conditions under which a subclass of queries admits polynomial time evaluation. We introduce a new hypergraph-based abstraction for ECRPQs, which allows us to define measures in order to simplify the evaluation problem. Using these measures, we state precisely the conditions on subclasses of ECRPQs which admit polynomial time, NP-complete and PSpace-complete evaluation.
Les relations synchronisées sont des relations sur les mots définies par des automates finis avec un mouvement synchrone des têtes. Elles sont considérées comme une extension naturelle des langages réguliers en dimension supérieure. Elles ont des propriétés théoriques robustes et sont suffisamment expressives pour trouver des applications dans une grande variété de domaines. Un de ces domaines est celui des bases de données de graphes, où le formalisme d'interrogation des Regular Path Queries est étendu avec des conjonctions et des relations synchronisées pour produire des Extended Conjunctive Regular Path Queries (ECRPQs). Ces requêtes, lorsqu'elles sont exploitées sur des bases de données, produisent des sommets avec des chemins dont les étiquettes correspondent à une relation synchronisées donnée.Nous étudions la caractérisation logique des relations synchronisées en nous appuyant sur le théorème d'Eilenberg et al., selon lequel l'ensemble des relations définissables par des formules du premier ordre de la théorie des mots avec les prédicats préfixe, égale_longueur et dernière_lettre, est exactement l'ensemble des relations synchronisées. Nous étudions la hiérarchie d'alternance des quantificateurs de cette logique, en montrant qu'elle s'effondre en puissance expressive au troisième niveau. De plus, nous caractérisons les niveaux inférieurs de cette hiérarchie - les niveaux un et deux et leurs fermetures booléennes - en fournissant une description combinatoire des sous-classes relationnelles correspondant aux niveaux inférieurs de cette hiérarchie. Un problème important dans ce contexte est l'appartenance ; pour un sous-ensemble C donné de relations synchrones, le problème de l'appartenance à C demande si une relation synchrone d'entrée appartient à C ou non.Nous montrons que l'appartenance à C est décidable pour toutes les sous-classes C de relations définissables dans les niveaux inférieurs de la hiérarchie d'alternance des quantificateurs.Nous étudions également le problème de l'évaluation des requêtes pour les ECRPQs, qui est connu pour être PSpace-complet.Un thème commun de la recherche sur l'évaluation des requêtes conjonctives et des CRPQ est de considérer des sous-classes de requêtes qui sont plus faciles à évaluer ; en d'autres termes, nous voulons spécifier exactement quelles sous-classes admettent une évaluation en temps polynomial. Nous introduisons une nouvelle abstraction basée sur les hypergraphes pour les ECRPQs, qui nous permet de définir des mesures afin de simplifier le problème d'évaluation. En utilisant ces mesures, nous énonçons précisément les conditions sur les sous-classes de ECRPQs qui admettent une évaluation en temps polynomial, NP-complet et PSpace-complet.
Fichier principal
Vignette du fichier
RAMANATHAN_VARUN_2022.pdf (3.06 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03884413 , version 1 (05-12-2022)

Identifiants

  • HAL Id : tel-03884413 , version 1

Citer

Varun Ramanathan. Synchronous relations and complexity of query evaluation. Databases [cs.DB]. Université de Bordeaux, 2022. English. ⟨NNT : 2022BORD0167⟩. ⟨tel-03884413⟩
60 Consultations
39 Téléchargements

Partager

Gmail Facebook X LinkedIn More