Skip to Main content Skip to Navigation
Theses

Evaluation of the use of public toxicological data for chemical hazard prediction through computational methods

Résumé : L’évaluation de la sécurité des composés chimiques repose principalement sur les résultats des études in vivo, réalisées sur des animaux de laboratoire. Cependant, ces études sont coûteuses en terme de temps, d'argent et d'utilisation d'animaux, ce qui les rend inadaptées à l'évaluation de milliers de composés. Afin de prédire rapidement la toxicité potentielle des composés et de les prioriser pour de futures études, des solutions alternatives sont actuellement envisagées telles que les essais in vitro et les modèles prédictifs d'apprentissage automatique. L’objectif de cette thèse est d’évaluer comment les données publiques de ToxCast et ToxRefDB peuvent permettre de construire de tels modèles afin de prédire les effets in vivo induits par les composés, uniquement à partir de leur structure chimique. A cette fin, et après pré-traitement des données, nous nous focalisons d’abord sur la prédiction de la bioactivité in vitro à partir de la structure chimique puis sur la prédiction des effets in vivo à partir des données de bio-activité in vitro. Pour la prédiction de la bio-activité in vitro, nous construisons et testons différents modèles de machine learning dont les descripteurs reflètent la structure chimique des composés. Puisque les données d'apprentissage sont fortement déséquilibrées en faveur des composés non toxiques, nous testons une technique d'augmentation de données et montrons qu’elle améliore les performances des modèles. Aussi, par une étude à grande échelle sur des centaines de tests in vitro de ToxCast, nous montrons que la méthode ensembliste "stacked generalization" mène à des modèles fiables sur leur domaine d'applicabilité. Pour la prédiction des effets in vivo, nous évaluons le lien entre les résultats des essais in vitro ciblant des voies connues pour induire des effets endocriniens et les effets in vivo observés dans les organes endocriniens lors d'études long terme. Nous montrons que, de manière inattendue, ces essais ne sont pas prédictifs des effets in vivo, ce qui soulève la question essentielle de la pertinence des essais in vitro. Nous faisons alors l’hypothèse que le choix d’essais capables de prédire les effets in vivo devrait reposer sur l’utilisation d'informations complémentaires comme, en particulier, les données mécanistiques.
Complete list of metadatas

Cited literature [315 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-02612815
Contributor : Abes Star :  Contact
Submitted on : Tuesday, May 19, 2020 - 4:01:18 PM
Last modification on : Tuesday, May 26, 2020 - 6:50:56 PM

File

2019AZUR4050.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-02612815, version 1

Collections

Citation

Ingrid Grenet. Evaluation of the use of public toxicological data for chemical hazard prediction through computational methods. Machine Learning [cs.LG]. Université Côte d'Azur, 2019. English. ⟨NNT : 2019AZUR4050⟩. ⟨tel-02612815⟩

Share

Metrics

Record views

177

Files downloads

117