Les bases de données graphes pour la science des données : implantation d'entrepôts des données et prédiction d'interactions protéine-protéine - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Graph databases for data science : implementation of data warehouses and prediction of protein-protein interactions

Les bases de données graphes pour la science des données : implantation d'entrepôts des données et prédiction d'interactions protéine-protéine

Résumé

With the rise of big data, the use of data science has become critically important to extract insights from a huge amount of data. In recent years, several categories of databases have been used in data science to efficiently store, manage and analyze huge amounts of data. In particular, NoSQL (Not Only SQL) databases have emerged as an alternative to relational databases. In this thesis, we are interested in the graph-oriented category of NoSQL databases that replaces expensive relational joins with graph traversals. We use graph databases to address two data science issues of concern that are our main contributions: Implementing data warehouses capable of responding quickly to complex analytical queries and constructing descriptors to be used to predict missing values on the edges of a protein-protein interaction network.
Avec l’essor du big data, le recours à la science des données est devenu crucial pour extraire les connaissances à partir des données massives. Ces dernières années, plusieurs catégories de bases de données ont été utilisées en science des données pour stocker, gérer et analyser efficacement les mégadonnées. En particulier, les bases de données NoSQL (Not Only SQL) ont émergé comme une alternative aux bases de données relationnelles. Dans cette thèse, nous nous intéressons à la catégorie orientée graphes des bases de données NoSQL qui remplace les jointures relationnelles coûteuses par des parcours du graphe. Nous les utilisons pour répondre à deux problématiques en science des données et qui constituent nos principales contributions : implanter des entrepôts de données capables de répondre rapidement à des requêtes analytiques complexes et construire des descripteurs afin de les utiliser pour prédire les valeurs manquantes sur les arcs d’un réseau d’interaction protéine-protéine.
Fichier principal
Vignette du fichier
AKID_Hajer_2022_ED269.pdf (5.13 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04103915 , version 1 (23-05-2023)

Identifiants

  • HAL Id : tel-04103915 , version 1

Citer

Hajer Akid. Les bases de données graphes pour la science des données : implantation d'entrepôts des données et prédiction d'interactions protéine-protéine. Base de données [cs.DB]. Université de Strasbourg; Université de Sfax (Tunisie), 2022. Français. ⟨NNT : 2022STRAD042⟩. ⟨tel-04103915⟩
60 Consultations
227 Téléchargements

Partager

Gmail Facebook X LinkedIn More