Signal processing and analysis of PTR-TOF-MS data from exhaled breath for biomarker discovery - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Signal processing and analysis of PTR-TOF-MS data from exhaled breath for biomarker discovery

Traitement du signal et analyse des données PTR-TOF-MS de l'air expiré pour la découverte de biomarqueurs

Résumé

The analysis of Volatile Organic Compounds (VOCs) in exhaled breath is a promising non-invasive approach in medicine for early diagnosis, phenotyping, disease and treatment monitoring and large-scale screening. Proton Transfer Reaction Time-Of-Flight Mass Spectrometry (PTR-TOF-MS) is of major interest for the real time analysis of VOCs and the discovery of new biomarkers in the clinics. However, there is currently a lack of methods and software tools for the processing of PTR-TOF-MS data from cohorts. We therefore developed a suite of algorithms that process raw data from the patient acquisitions, and build the table of feature intensities, through expiration and peak detection, quantification, alignment between samples, and missing value imputation. Notably, we developed an innovative 2D peak deconvolution model based on penalized splines signal regression, and a method to specifically select the VOCs from exhaled breath. The full workflow is implemented in the freely available ptairMS R/Bioconductor package. Our approach was validated both on experimental data (mixture of VOCs at standardized concentrations) and simulations, which showed that the sensitivity for the identification of VOCs from exhaled breath reached 99 %. A graphical interface was also developed to facilitate data analysis and result interpretation by experimenters (e.g., clinicians). We applied our methodology to the characterization of exhaled breath from mechanically ventilated adults with COVID-19 infection. Analysis of exhaled breath from 28 patients with an acute respiratory distress syndrome (ARDS) and COVID-19 infection, and 12 patients with non-COVID-19 ARDS were performed daily from the hospital admission to the discharge. First, classification models were built to predict the status of the infection, using the closest available acquisition to the entry into hospital, and achieved high prediction accuracies (93 %). Then, all the available data acquired during the hospital stay were used for the longitudinal analysis of the VOCs evolution as a function of the hospitalization time by mixed-effects modeling. Following feature ranking and selection, four biomarkers of COVID-19 infection were identified. Altogether, these results highlight the value of the PTR-TOF-MS data and the ptairMS software for biomarker discovery in exhaled breath.
L'analyse des composés organiques volatils (COVs) dans l'air expiré est une méthode non invasive prometteuse en médecine pour le diagnostic précoce, le phénotypage, le suivi de la maladie et du traitement et le dépistage à grande échelle. La spectrométrie de masse à temps de vol par réaction de transfert de protons (PTR-TOF-MS) présente un intérêt majeur pour l'analyse en temps réel des COVs et la découverte de nouveaux biomarqueurs. Le manque de méthodes et d'outils logiciels pour le traitement des données PTR-TOF-MS provenant de cohortes représente actuellement un verrou pour le développement de ces approches.Nous avons ainsi développé une suite d'algorithmes permettant le traitement des données brutes jusqu’au tableau des intensités des molécules détectées, grâce à la détection des expirations et des pics dans les spectres de masse, la quantification dans la dimension temporelle, l'alignement entre les échantillons et l'imputation des valeurs manquantes. Nous avons notamment mis au point un modèle innovant de déconvolution des pics en 2 dimensions reposant sur une régression du signal par splines pénalisées, ainsi qu'une méthode permettant de sélectionner spécifiquement les COVs dans l'air expiré. L'ensemble du processus est implémenté dans le paquet R/Bioconductor ptairMS, disponible en ligne. Nous avons validé notre approche à la fois sur des données expérimentales (mélange de COVs à des concentrations standardisées) et par simulation. Les résultats montrent que l'identification des COVs provenant de l’air expiré à partir du modèle proposé atteint une sensibilité de 99 `%. Une interface graphique a également été développée pour faciliter l'analyse des données et l'interprétation des résultats par les expérimentateurs (les cliniciens notamment). Nous avons appliqué notre méthodologie à la caractérisation de l'air expiré d'adultes sous ventilation mécanique atteints de l’infection COVID-19. Les analyses de l'air expiré de 40 patients atteints d’un syndrome de détresse respiratoire aiguë (SDRA) ont été effectuées quotidiennement, de l'entrée à la sortie de l'hôpital. Nous avons d'abord réalisé un modèle de classification pour prédire le statut de l'infection, en utilisant l'acquisition disponible la plus proche de l’admission à l'hôpital.Ce modèle permet de prédire le statut de l'infection avec une précision de 93%. Ensuite, nous avons utilisé toutes les données disponibles pour une analyse longitudinale de l'évolution des COVs en fonction de la durée de l'hospitalisation, en utilisant un modèle à effets mixtes. Après sélection de variables, quatre biomarqueurs de l'infection par le COVID-19 ont pu être identifiés. Ces résultats soulignent la valeur des données PTR-TOF-MS et du logiciel ptairMS pour la découverte de biomarqueurs dans l'air expiré.
Fichier principal
Vignette du fichier
106364_ROQUENCOURT_2022_archivage.pdf (10.43 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03662449 , version 1 (09-05-2022)

Identifiants

  • HAL Id : tel-03662449 , version 1

Citer

Camille Roquencourt. Signal processing and analysis of PTR-TOF-MS data from exhaled breath for biomarker discovery. Genomics [q-bio.GN]. Université Paris-Saclay, 2022. English. ⟨NNT : 2022UPASG024⟩. ⟨tel-03662449⟩
292 Consultations
390 Téléchargements

Partager

Gmail Facebook X LinkedIn More