Mathematical and statistical modeling of epidemic data : application to the novel COVID-19 outbreak - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Mathematical and statistical modeling of epidemic data : application to the novel COVID-19 outbreak

Modélisation mathématique et statistique des données épidémiques : application à la nouvelle épidémie de COVID-19

Résumé

This thesis is devoted to the mathematical and statistical modeling of epidemic data andIt is divided into two broad parts, which are subdivided into different sections. The modeling of infectious diseases has been a subject of interest to researchers, policy makers, andmedical practitioners, most especially during the recent global COVID-19 pandemic, whichIt has been devastating to the health infrastructure and socio-economic status of many nations.It has affected mobility and interaction among citizens due to the many daily new cases and deaths.Hence, the need to contribute to understanding the mechanisms of virulence and spread using different mathematical and statistical modeling approaches. The first part is dedicated to the mathematical modeling aspect, which consists of the deterministic and discrete approaches to epidemiology modeling, which in this case is mainly focused on the COVID-19 pandemic. The daily reproduction number of the COVID-19 outbreak calculation is approached by discretization using the idea of deconvolution and a unique biphasic pattern is observed that is more prevalent during the contagiousness period across various countries. Furthermore, a discrete model is formulated from Usher’s model in order to calculate the life span loss due to COVID-19 disease and to also explain the role of comorbidities, which are very essential in the disease spread and its dynamics at an individual level. Also, the formulation of Susceptible-Infectious-Geneanewsusceptible-Recovered (SIGR) age-dependent modelling is proposed in order to perform some mathematical analysis and present the role of different epidemiology parameters, most especially vaccination, and finally, a new technique to identify the point of inflection on the smoothed curves of the new infected pandemic cases using the Bernoulli equation is presented. This procedure is important because not all countries have reached the turning point (maximum number of daily cases) in the epidemic curve. The approach is used to calculate the transmission rate and the maximum reproduction number for various countries.The statistical modelling of the COVID-19 pandemic using various data analysis models (namely machine and deep learning models) is presented in the second part in order to understand the dynamics of the pandemic in different countries and also predict and forecast the daily new cases and deaths due to the disease alongside some socio-economic parameters. It is observed that the prediction and forecasting are consistent with the disease evolution at different waves in these countries and that there are socio-economic determinants of the disease depending on whether the country is developed or developing. Also, the study of the shapes and peaks of the COVID-19 disease is presented. The peaks of the curves of the daily new cases and deaths are identified using the spectral analysis method, which enables the weekly peak patterns to be visible. Finally, the clustering of different regions in France due to the spread of the disease is modeled using functional data analysis. The study shows clear differences between the periods when vaccination has not been introduced (but only non-pharmaceutical mitigation measures) and when it was introduced. The results presented in this thesis are useful to better understand the modeling of a viral disease, the COVID-19 virus.
Cette thèse est consacrée à la modélisation des épidémies et elle est divisée en deux parties qui se subdivisent elles-mêmes en différentes sections. La modélisation des maladies infectieuses a suscité depuis de nombreuses années (la première modélisation de la propagation de la variole de D. Bernoulli date de 1760)) l’intérêt des décideurs et des médecins, plus particulièrement lors de la récente pandémie de COVID-19, qui a déstabilisé les infrastructures de santé, et affecté les interactions entre citoyens dans de nombreux pays, en raison de multiples cas et décès, d’où la nécessité de comprendre les mécanismes de virulence et de propagation, à l’aide de diverses approches de modélisation mathématique et statistique.La première partie est consacrée à l’aspect modélisation mathématique d’une épidémie, quiconsiste en des approches déterministes et discrètes de la propagation épidémique, princi-palement axée sur la pandémie de COVID-19. Le nombre quotidien de reproduction durantla période de contagiosité est approché par discrétisation, fondée sur l’idée de déconvolution,et la forme bi-phasique a été la plus souvent calculée dans divers pays, ceci étant possible,si on suppose que la maladie a commencé par un unique patient infectieux « zéro » au dé-marrage de l’épidémie et que les taux de transmission et la taille de la population susceptiblesont constants en phase de croissance exponentielle des nouveaux cas observés. Ensuite, unmodèle discret été formulé à partir du modèle d’Usher, afin de calculer la perte de durée devie des infectés, due à la maladie COVID-19 et afin d’expliquer également le rôle des comor-bidités, qui est très essentiel dans la propagation de la maladie et sa dynamique au niveauindividuel. En outre, une formulation de la modélisation de la dynamique épidémique dépen-dante de l’âge des infectés, de type Susceptible-Infectious-Geneanewsusceptible-Recovered(SIGR), a été proposée, afin d’analyser le rôle de différents paramètres épidémiologiques,plus particulièrement celui de la vaccination. Enfin, une nouvelle technique a été proposéepour identifier le point d’inflexion sur les courbes lissées des nouveaux cas infectés, cela àl’aide de l’équation princeps de Bernoulli. Cette procédure est importante, car les vaguesde nombreux pays n’ont pas atteint le point de retournement (maximum de cas quotidiens)de leur courbe épidémique, en particulier pour des vagues proches, dans lesquelles on peutavoir une succession d’épaulements, mais pas de maximas. La modélisation statistique de lapandémie de COVID-19, à l’aide de divers modèles d’apprentissage automatique et profond,est présentée dans la deuxième partie, afin de comprendre la dynamique de la pandémie dans différents pays, ainsi que de prédire et de prévoir les nouveaux cas quotidiens et les décès dus à la maladie, ainsi que certains paramètres socio-économiques. On observe que la prédiction et la prévision sont cohérentes avec l’évolution de la maladie durant différentes vagues dans ces différents pays, et qu’il existe des déterminants socio-économiques de la maladie, selon que le pays est développé ou en voie de développement. De plus, l’étude du nombre et des formes des pics de la maladie COVID-19 est présentée. Les pics des courbes des nouveaux cas et des décès quotidiens sont identifiés à l’aide d’une méthode d’analyse spectrale, qui permet de visualiser les modèles de pics hebdomadaires. Enfin, la classification des départements français vis-à-vis de la propagation de la maladie est effectuée par analyse fonctionnelle des données. Cette dernière étude montre des différences nettes entre la période où la vaccination n’a pas encore été introduite (seulement des mesures d’atténuation non pharmaceutiques) et celle où elle l’a été. Les résultats de cette thèse seront particulièrement utiles dans le futur pour mieux comprendre les mécanismes de propagation d’une maladie virale, ici la maladie due au virus SARS-CoV-2.
Fichier principal
Vignette du fichier
OSHINUBI_2022_archivage.pdf (37.19 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03943836 , version 1 (17-01-2023)

Identifiants

  • HAL Id : tel-03943836 , version 1

Citer

Kayode Oshinubi. Mathematical and statistical modeling of epidemic data : application to the novel COVID-19 outbreak. Modeling and Simulation. Université Grenoble Alpes [2020-..], 2022. English. ⟨NNT : 2022GRALS029⟩. ⟨tel-03943836⟩

Collections

UGA STAR TDS-MACS
213 Consultations
39 Téléchargements

Partager

Gmail Facebook X LinkedIn More