Découverte de connaissances à partir de grands graphes biologiques - TEL - Thèses en ligne Accéder directement au contenu
Hdr Année : 2023

Knowledge discovery from large biological graphs

Découverte de connaissances à partir de grands graphes biologiques

Sabeur Aridhi

Résumé

Graphs are used in many different fields, ranging from social networks computer security, geography and bioinformatics. Their versatility and their ability to model complex data make them a valuable tool for solving several problems especially in the domain of knowledge extraction from biological graphs which is our domain of interest. However, the use of graphs can present several challenges such as data representation, scalability and the dynamic/temporal behavior of some real world graphs. In the particular case of biological graphs, challenges related to the complexity of biological systems, interpretability and validation could be raised. Without achieving all of these challenges, we present in this manuscript several contributions. First, we present a novel protein-protein network (PPN) based approach which combines the notion of domain similarity with a graph neighborhood inference technique for protein function annotation. Then, we describe an explainable link prediction approach in biological knowledge graphs for drug repositioning. Finally, we present our contributions on distributed graph clustering and large-scale knowledge graph embedding.
Les graphes sont utilisés dans de nombreux domaines différents, allant de la sécurité informatique des réseaux sociaux, à la géographie et à la bioinformatique. Leur polyvalence et leur capacité à modéliser des données complexes en font un outil précieux pour résoudre plusieurs problèmes notamment dans le domaine de l’extraction de connaissances à partir de graphes biologiques qui est notre domaine d’intérêt. Cependant, l’utilisation de graphes peut présenter plusieurs défis tels que la représentation des données, l’évolutivité et le comportement dynamique/ temporel de certains graphes réels. Dans le cas particulier des graphes biologiques, des défis liés à la complexité des systèmes biologiques, à l’interprétabilité et à la validation pourraient être soulevés. Sans s’attaquer à l’ensemble de ces défis majeurs, nous présentons dans ce manuscrit d’HDR plusieurs contributions. Tout d’abord, nous présentons une nouvelle approche basée sur un graphe de protéines qui combine la notion de similarité de domaine avec une technique d’inférence de voisinage de graphe pour l’annotation de la fonction des protéines. Ensuite, nous décrivons une approche de prédiction de liens explicables dans les graphes de connaissances biologiques pour le repositionnement des médicaments. Enfin, nous présentons nos contributions sur le clustering de graphes distribués et le plongement de graphes de connaissances à grande échelle.
Fichier principal
Vignette du fichier
Manuscrit_HDR_Sabeur_Aridhi.pdf (6.8 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-04364210 , version 1 (26-12-2023)

Licence

Domaine public

Identifiants

  • HAL Id : tel-04364210 , version 1

Citer

Sabeur Aridhi. Découverte de connaissances à partir de grands graphes biologiques. Informatique [cs]. Université de Lorraine, 2023. ⟨tel-04364210⟩
42 Consultations
15 Téléchargements

Partager

Gmail Facebook X LinkedIn More