Prise en compte de l’organisation hiérarchique des espèces pour la découverte de signatures métagénomiques multi-échelles. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

Discovering multi-scale metagenomic signatures through hierarchical organization of species.

Prise en compte de l’organisation hiérarchique des espèces pour la découverte de signatures métagénomiques multi-échelles.

Résumé

This thesis deals with the use of hierarchical information in differential abundance analyses in metagenomics. Taxa that make up the microbiome are usually associated with a tree, like the taxonomy or the phylogeny, that reflects a biological link between them. It is therefore natural to exploit this hierarchical information to increase the statistical power of differential abundance techniques. We first investigated the efficiency of existing hierarchical differential abundance detection procedures and the impact of tree choice on those. We then developed our own hierarchical differentially abundance detection procedure. It models the taxaassociated z-scores as realization of an Ornstein- Uhlenbeck process on a tree with shifts on its optimal value then a lasso-like regression is used to identify optimal positions and intensities of the shifts.
Cette thèse porte sur l'inclusion d'informations hiérarchiques dans des procédures de détection d'abondance différentielle sur des données métagénomiques. Les différents taxons qui composent le microbiote sont généralement accompagnés d'un arbre, comme la taxonomie ou la phylogénie, qui traduit une proximité biologique entre eux. Il est alors naturel de vouloir tirer parti de cette information hiérarchique afin d'augmenter la puissance des tests de détection de taxons différentiellement abondants. Dans un premier temps, nous nous sommes intéressés aux performances des procédures hiérarchiques existantes et à l'impact du choix de l'arbre sur celles-ci. Dans un second temps, nous avons développé notre propre méthode hiérarchique de détection d'abondance différentielle. Celle-ci modélise les z-scores associés à chaque taxon comme la réalisation d'un processus d'Ornstein-Uhlenbeck sur arbre avec sauts dans la valeur optimale du processus puis effectue une régression de type lasso pour déterminer les positions et intensités optimales des sauts.
Fichier principal
Vignette du fichier
2020UPASM016.pdf (18.05 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03121038 , version 1 (26-01-2021)

Identifiants

  • HAL Id : tel-03121038 , version 1

Citer

Antoine Bichat. Prise en compte de l’organisation hiérarchique des espèces pour la découverte de signatures métagénomiques multi-échelles.. Statistiques [math.ST]. Université Paris-Saclay, 2020. Français. ⟨NNT : 2020UPASM016⟩. ⟨tel-03121038⟩
186 Consultations
56 Téléchargements

Partager

Gmail Facebook X LinkedIn More