Détection de communautés dans les grands réseaux : Application aux réseaux d'interactions de gènes - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Community detection in complex networks : Application to gene interaction network

Détection de communautés dans les grands réseaux : Application aux réseaux d'interactions de gènes

Résumé

In our work, we are interested in the communities' detection in protein-protein interaction networks (PPI). Thesecommunities give us an idea about the perception of the network’s structure. One of the goals in biology is todetermine how genes or proteins encode function in the cell. This work is multidisciplinary, as it brings the field ofbiology and computer science in the broad sense. Thus, our objectif is to find communities of genes having abiological sense (that participate in the same biological processes or that perform together specific biologicalfunctions) from gene annotation sources. To make this task, we have combined three levels of information : i)Semantic level: information contained in biological ontologies such as Gene Ontology (GO) and informationobtained by the use of a similarity measure such as GO-based similarity of gene sets (GS2). It assesses thesemantic similarity between genes, ii) Functional level: information contained in public databases describing theinteractions of genes iii) Networks level: information contained in pathway databases. Our work has four parts.The first part focuses on the extraction of biological data used in our project. Thus, we study the semantic similaritybetween groups of genes that are annotated by terms of biological ontology. It is one of the characteristics of agene community. The second part present the proposed approach GA-PPI-Net for the detection of genecommunities. It is a Genetic Algorithm based approach to detect communities having different sizes from PPInetworks. For this purpose, we use a fitness function based on a similarity measure and the interaction valuebetween proteins or genes. Moreover, a specific solution for representing a community and a specific mutationoperator are introduced. The third part presents two extensions of GA-PPI-Net. The first one proposes a specificadaptive mutation operator. The second aims to make GA-PPI-Net generic by allowing finding different sizes ofcommunities based on the interaction and/or similarity criterion. This approach called Generic GA-PPI-Net. Finally,we propose to scale Generic GA-PPI-Net using the active learning paradigm. This approach allowed us to use alarge data sets (the whole humain PPI) to build evolutionary communities. It is based on an adaptive samplingapproach to define the part of the graph to be explored by the genetic operators during the GA evolution.
Dans le cadre de cette thèse de doctorat, nous nous intéressons à la détection des communautés de gènes dansles réseaux d’interactions de protéine-protéine. Ces communautés correspondent à des ensembles de gènes quicollaborent à une même fonction cellulaire. Notre objectif consiste à déterminer un groupe ou une communautéde gènes à partir des sources d’annotation en se basant sur l’apprentissage automatique. Pour réaliser ce travail,nous combinons trois niveaux d’informations : i) le niveau sémantique : information contenue dans les ontologiesbiologiques (gene Ontology), ii) le niveau fonctionnel : information contenue dans des bases de données publiquesqui décrivent les interactions des gènes et iii) le niveau réseau : informations contenues dans les bases de voiesbiologiques. Ce travail est multidisciplinaire, à l'intersection de domaine de l’informatique et de la biologie et ilcomporte quatre volets.Le premier volet se concentre sur l’extraction des données biologiques utiles pour notre projet et sur l'étude de lasimilarité sémantique entre des groupes de gènes. Cette dernière sera l’une de caractéristique d’une communautéde gènes. Nous avons proposé, dans le deuxième volet, une approche pour la détection des communautés degènes basée sur les algorithmes génétiques. Cette approche nommée GA-PPI-Net permet de construire et dedétecter des communautés de gènes de tailles variables. GA-PPI-Net permet de maximiser une mesurecommunautaire qui combine à la fois des informations topologiques entre les gènes et des informationssémantiques. Par ailleurs, nous avons introduit une solution spécifique pour représenter une communauté(=solution) de taille variable et un opérateur de mutation optimisée. Dans le troisième volet, nous nous focalisonssur l'extension et l'amélioration de GA-PPI-Net. La première extension sert à proposer un nouvel opérateur demutation adaptatif. Cette amélioration a pour objectif d’optimiser l’exploration de l’espace de recherche afind’améliorer les qualités des communautés obtenues. La deuxième amélioration vise à rendre notre approchegénérique, Generic GA-PPI-Net, pour construire des communautés de gènes qui sont sémantiquement similaireset/ou sont en interaction. Dans le dernier volet, nous avons étendu ce travail afin de mettre à l’échelle Generic GAPPI-Net en utilisant le paradigme d’apprentissage actif. Cette extension nous a permis d’utiliser des sources dedonnées volumineuses (la totalité de réseau d’interaction de protéine chez l’être humain) pour construire descommunautés évolutives. Elle est basée sur une approche d’échantillonnage adaptative permettant de définir lapartie du graphe à explorer par les opérateurs génétiques pendant l’évolution.
Fichier principal
Vignette du fichier
2022UPSLD024.pdf (5.17 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04048631 , version 1 (28-03-2023)

Identifiants

  • HAL Id : tel-04048631 , version 1

Citer

Marwa Ben M'Barek. Détection de communautés dans les grands réseaux : Application aux réseaux d'interactions de gènes. Bio-informatique [q-bio.QM]. Université Paris sciences et lettres; Université Tunis El Manar. Faculté des Sciences Mathématiques, Physiques et Naturelles de Tunis (Tunisie), 2022. Français. ⟨NNT : 2022UPSLD024⟩. ⟨tel-04048631⟩
60 Consultations
36 Téléchargements

Partager

Gmail Facebook X LinkedIn More