Force Field Parameterization in Molecular Simulation by Machine Learning Methods - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2023

Force Field Parameterization in Molecular Simulation by Machine Learning Methods

Paramétrisation des champs de force en simulation moléculaire par méthode d'apprentissage statistique

Gong Chen
  • Fonction : Auteur
  • PersonId : 1255349
  • IdRef : 277146526

Résumé

Molecular dynamics simulation allows for predictions of material properties, aiding in the understanding, researching, and development of new materials. However, the accuracy of molecular force fields has been a long-standing limitation. Traditional force fields assign parameters based on the combinations of discrete atom type, which encodes all information about the atom's chemical environment. Higher accuracy requires more atom types, resulting in the proliferation of redundant parameters and low transferability. We propose to use graph neural networks to process directed molecular graphs and to extract continuous atomic representations, which will be used to derive a set of force fields parameters directly. The whole framework is called Graph-Based Force Fields (GB-FFs) model and it is allowed to learn directly from quantum chemical energies and forces. In Chapter 1, we initially employe machine learning to predict the parameters for polynomial interpolation, demonstrating that neural networks can effectively handle simple parameterization tasks. In Chapter 2, we represent molecules as strings and utilize Natural Language Processing models to extract molecular fingerprints. In Chapter 3, we introduce Directed Graph Attention neTworks to handle directed molecular graphs, extracting molecular fingerprints and predicting molecular properties. In the final chapter, building upon the models from previous chapters, we propose the GB-FFs model, which accomplishes end-to-end molecular force field parameterization. Our methods have been demonstrated to be a reliable approach for optimizing and accelerating molecular force field parameterization. Currently, GB-FFs model has been tested and validated on the General AMBER Force Field (GAFF). In the future, it can be easily extended and applied to other force fields as well.
La simulation de dynamique moléculaire permet de prédire les propriétés des matériaux, ce qui aide à la compréhension, à la recherche et au développement de nouveaux matériaux. Cependant, la précision des champs de force moléculaire a été une limitation depuis longtemps. Les champs de force traditionnels attribuent des paramètres selon des combinaisons de types d'atomes discrets, ce qui encode toutes les informations sur l'environnement chimique de l'atome. Une plus grande précision nécessite davantage de types d'atomes, ce qui entraîne une prolifération de paramètres redondants et une faible transférabilité. Nous proposons d'utiliser des réseaux neuronaux graphiques pour traiter des graphes moléculaires dirigés et extraire des représentations atomiques continues, qui seront utilisées pour dériver des paramètres de champs de force directement. L'ensemble du cadre est appelé modèle de Graph-Based Force Fields (GB-FFs) et il est autorisé à apprendre directement à partir des énergies potentials et des forces atomiques. Dans le chapitre 1, nous utilisons initialement l'apprentissage automatique pour prédire les paramètres d'interpolation polynomiale, démontrant que les réseaux neuronaux peuvent gérer efficacement des tâches de paramétrisation simples. Dans le chapitre 2, nous représentons les molécules sous forme de chaînes et utilisons des modèles de traitement du langage naturel pour extraire des empreintes moléculaires. Dans le chapitre 3, nous introduisons les réseaux d'attention de graphe dirigés pour traiter les graphes moléculaires dirigés, extraire des empreintes moléculaires et prédire les propriétés moléculaires. Dans le dernier chapitre, en nous appuyant sur les modèles des chapitres précédents, nous proposons le modèle GB-FFs, qui permet la paramétrisation des champs de force de bout en bout. Nos méthodes ont été démontrées comme une approche fiable pour optimiser et accélérer la paramétrisation des champs de force moléculaire. Actuellement, le modèle GB-FFs a été testé et validé sur le General AMBER Force Field (GAFF). À l'avenir, il pourra facilement être étendu et appliqué à d'autres champs de force également.
Fichier principal
Vignette du fichier
141419_CHEN_2023_archivage.pdf (32.71 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04549954 , version 1 (17-04-2024)

Identifiants

  • HAL Id : tel-04549954 , version 1

Citer

Gong Chen. Force Field Parameterization in Molecular Simulation by Machine Learning Methods. Mathematics [math]. Sorbonne Université, 2023. English. ⟨NNT : 2023SORUS690⟩. ⟨tel-04549954⟩
0 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More