Recherche combinatoire guidée par apprentissage artificiel en chimie moléculaire - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Combinatorial search lead by machine learning for molecular chemistry

Recherche combinatoire guidée par apprentissage artificiel en chimie moléculaire

Résumé

The search for molecules that satisfy target molecular properties is an important issue for molecular chemisty. In this thesis, we aim to tackle in particular problems related to the domain of organic molecular materials. These problems depend on costly evaluation functions. In our work, we consider the search of molecules satisfying molecular properties as a combinatorial optimization problem of molecular graphs. We propose an evolutionary algorithm for the optimization of molecular properties that is designed to be generic and interpretable, and we show that it can successfully optimize numerous target properties. We propose an approach that is based on binary constraints to favor the generation of realistic molecules. We define an ef ficient maximization approach of molecular diversity, based on our evolutionary algorithm. It allows for the generation of a dataset of molecules with high molecular diversity, and we also show that the diversity objective can improve the efficiency of the search for the optimization of a target molecular property. Finally, we propose a surrogate-based blackbox optimization method that is designed for the optimization of costly molecular properties, and we perform a detailed study of our approach.
La recherche de molécules satisfaisant des propriétés moléculaires cibles est un enjeu majeur en chimie moléculaire. Dans le cadre de cette thèse, nous cherchons à aborder en particulier des problèmes liés au domaine de la chimie des matériaux moléculaires organiques. Ces problèmes dépendent de fonctions d’évaluation des propriétés cibles dont le calcul est coûteux. Dans nos travaux, nous considérons la recherche de molécules satisfaisant des propriétés cibles comme un problème d’optimisation combinatoire de graphes moléculaires. Nous proposons un algorithme évolutionnaire générique et interprétable pour l’optimisation de propriétés moléculaires, et nous montrons qu’il permet d’optimiser avec succès de nombreuses propriétés. Nous proposons une approche par contrainte pour favoriser le réalisme des solutions générées. Nous définissons une méthode d’optimisation efficace pour la maximisation de la diversité moléculaire, basée sur notre algorithme évolutionnaire. Cela nous permet de générer un jeu de molécules très divers. Nous montrons également que l’objectif de diversité peut apporter un gain d’efficacité pour l’optimisation d’une propriété moléculaire cible. Finalement, nous proposons une approche d’optimisation boîte-noire basée sur un modèle de substitution qui est définie pour l’optimisation de propriétés coûteuses, et nous en menons une étude approfondie.
Fichier principal
Vignette du fichier
LEGUY.pdf (18.91 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04053697 , version 1 (31-03-2023)

Identifiants

  • HAL Id : tel-04053697 , version 1

Citer

Jules Leguy. Recherche combinatoire guidée par apprentissage artificiel en chimie moléculaire. Informatique et langage [cs.CL]. Université d'Angers, 2022. Français. ⟨NNT : 2022ANGE0061⟩. ⟨tel-04053697⟩
77 Consultations
14 Téléchargements

Partager

Gmail Facebook X LinkedIn More