Une ballade en forêts aléatoires : Théorèmes limites pour des populations structurées et leurs généalogies, étude probabiliste et statistique de modèles SIR en épidémiologie, contributions à la géométrie aléatoire

Résumé : Cette habilitation contient trois parties. Le premier chapitre s'intéresse à modèles individu-centrés de populations structurées, où les dynamiques individuelles (reproductions, compétitions, morts, vieillissement) sont supposées dépendre du passé, au travers des âges des individus ou de leurs lignées ancestrales, et de covariables héréditaires (sauf lorsqu'il y a mutation), appelées traits. En grandes populations, les processus aléatoires à valeurs mesures décrivant ces populations peuvent être approchés par des solutions d'EDP ou par des processus diffusifs, suivant les échelles de temps en jeu. Dans ce deuxième cas de figure, des phénomènes d'homogénéisation se produisent pour le vieillissement. Des méthodes de martingales introduites par Kurtz sont utilisées pour séparer échelles de temps lentes et rapides, répondant ainsi à des questions étudiées entre autres par Dynkin, Kaj et ses co-auteurs... mais non résolues dans les cas considérés ici. Pour décrire l'évolution des généalogies, des processus de naissances et morts historiques, au sens de Dawson et Perkins, sont proposés et nous en étudions les limites super-processus. La loi de la trajectoire ancestrale d'un individu tiré au hasard à un instant donné est difficile à décrire. Dans le cas sans interaction, nous pouvons répondre à cette question, en utilisant des représentations 'many-to-one', mettant en évidence des phénomènes de biais. Une application pour les modèles multi-niveaux est considérée. La seconde partie de ce chapitre s'intéresse à l'introduction de démographie et d'aléa dans deux modèles de génétique des populations. Un premier modèle, pour expliquer la génération et le maintien de la diversité neutre en présence de traits sous sélection, nous apporte un éclairage nouveau sur les phylogénies qu'il est possible de reconstruire à partir du polymorphisme génétique observé à un temps donné. Ensuite, une étude de populations possédant des systèmes de reproduction auto-incompatibles (par exemple les plantes à fleurs) est exposée, amenant à des problèmes de marches aléatoires non homogènes sur le quart de plan positif et absorbées sur la frontière. Dans le second chapitre, nous présentons des modèles probabilistes et statistiques pour l'épidémiologie, motivés par les données collectées entre 1986 et 2006 à Cuba par le système de contact-tracing pour le SIDA. L'estimation statistique, par exemple pour évaluer les efficacités respectives de différents modes de dépistage, est rendue difficile par le fait que les personnes infectieuses non dépistées sont inobservées. L'ABC, une méthode bayésienne, apparaît comme adaptée au problème et au format et à la taille des données. Nous avons également une observation partielle des graphes d'infections et de détections pour Cuba (5389 noeuds reliés par 4073 arêtes, avec une composante géante de 2386 noeuds et 3168 arêtes, ce qui est unique dans la littérature sur le SIDA). L'étude statistique de ce graphe et la mise en évidence de communautés par des méthodes de 'clustering' ont été réalisées. D'un point de vue plus probabiliste, des théorèmes limites liés aux épidémies se propageant sur des grands graphes aléatoires de distributions de degrés données sont établis, fournissant trois équations à valeurs mesures pour décrire les distributions de degrés sous-jacentes au problème, et justifiant ainsi rigoureusement les EDO proposées par Volz qui ont eu un écho important dans le domaine. Le troisième chapitre décrit deux contributions en géométrie aléatoire. La première concerne l'approximation de l'espérance de Vorob'ev d'ensembles aléatoires. La seconde est motivée par l'étude du 'Radial Spanning Tree' (RST) et de la 'Directed Spanning Forest' (DSF) introduits par Baccelli et Bordenave. Ces objets exhibent des structures de dépendance complexes qui empêchent l'utilisation des techniques classiques fondées sur les martingales, par exemple. Pour montrer que la DSF est un arbre sans chemin bi-infini, ou pour étudier les géodésiques et les interfaces du RST et montrer qu'il admet avec probabilités strictement positives 1, 2, 3, 4 ou 5 sous-arbres enracinés en l'origine, des arguments géométriques ou venant de la percolation sont invoqués.
Liste complète des métadonnées

Littérature citée [163 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01087229
Contributeur : Viet Chi Tran <>
Soumis le : mardi 25 novembre 2014 - 15:48:40
Dernière modification le : mardi 3 juillet 2018 - 11:33:38
Document(s) archivé(s) le : jeudi 26 février 2015 - 12:01:42

Identifiants

  • HAL Id : tel-01087229, version 1

Collections

Citation

Viet Chi Tran. Une ballade en forêts aléatoires : Théorèmes limites pour des populations structurées et leurs généalogies, étude probabiliste et statistique de modèles SIR en épidémiologie, contributions à la géométrie aléatoire. Probabilités [math.PR]. Université Lille 1, 2014. 〈tel-01087229〉

Partager

Métriques

Consultations de la notice

684

Téléchargements de fichiers

517