27 articles  [english version]
Fiche détaillée Thèses
École Nationale Supérieure des Mines de Paris (10/12/2009), Gérard Dreyfus (Dir.)
Liste des fichiers attachés à ce document : 
PDF
Toukourou._v2.pdf(31.6 MB)
Application de l'apprentissage artificiel à la prévision des crues éclair
Mohamed Samir Toukourou1, 2, 3, 4

L'objet de cette thèse est d'appliquer l'apprentissage statistique à la prévision des crues éclair cévenoles qui ont occasionné des pertes humaines et des dégâts considérables durant ces 20 dernières années. Les travaux s'inscrivent dans le cadre du projet Bassin Versant Numérique Expérimental Gardons. Dans ce contexte, ce mémoire se propose de présenter les travaux effectués pour réaliser la prévision des crues du Gardon d'Anduze à Anduze, jusqu'à un horizon de prévision de l'ordre de grandeur du temps de concentration, en l'absence de prévision de pluie, par des méthodes d'apprentissage statistique. La première partie de ce mémoire s'attache donc à présenter la famille de fonctions choisies pour réaliser cette tâche - les réseaux de neurones utilisés pour la prévision du comportement d'un processus dynamique non linéaire -, les propriétés fondamentales qui justifient leur utilisation de ces réseaux de neurones (l'approximation universelle et la parcimonie), ainsi que les méthodes connues pour éviter le surajustement. La deuxième partie de ce mémoire présente le cours d'eau qui constitue l'objet de l'étude : le Gardon d'Anduze et ses Gardonnades ainsi que les études hydrologiques qui y sont consacrées. La troisième partie s'intéresse à la mise en œuvre de méthodes de régularisation connues : la modération des poids et l'arrêt précoce. L'efficacité de ces méthodes est connue, mais il a fallu les adapter dans ce travail pour parvenir à estimer le comportement très intense d'un événement extrême. Le mémoire montre comment éviter les phénomènes de spécialisation observés en fonction de l'ensemble d'arrêt, et il introduit la validation croisée partielle, qui est en fait spécialisée sur les événements intenses. C'est grâce à l'établissement d'une typologie des événements, et grâce à une distribution judicieuse de ceux-ci dans les différents sous-ensembles d'apprentissage, de validation, d'arrêt et de test, qu'une procédure générale a pu être établie pour définir ces sous-ensembles et concevoir le modèle de prévision. Les performances du modèle obtenu en prévision permettent d'envisager qu'une alerte fiable soit disponible sur Internet par l'intermédiaire du SCHAPI et de son site vigicrues, rendant ainsi une aide précieuse aux populations. Ainsi, ce mémoire établit que, contrairement à ce que l'on peut lire dans de nombreuses publications sur les réseaux de neurones appliqués à la prévision des crues, il n'est pas impossible de généraliser à un événement plus intense que ceux de l'ensemble d'apprentissage et il n'est pas non plus impossible d'éviter le surajustement au bruit dans les mesures. C'est également pour cela que les perspectives ouvertes par ce travail sont particulièrement importantes, tant pour intégrer de l'adaptativité dans le modèle que pour généraliser leur application à des bassins versants non jaugés.
1 :  Laboratoire Signaux, Modèles et Apprentissage Statistique
2 :  CMGD - Centre des Matériaux de Grande Diffusion
3 :  CMA - Centre de Mathématiques Appliquées
4 :  CAOR - Centre de Robotique
Machine learning – Crues subites – Réseaux de neurones – Régularisation

Artificial intelligence application on the forecasting of flash floods
The need for accurate predictions of flash floods has been highlighted by the recent occurrences of catastrophic floods. The scope of this thesis is therefore to apply machine learning to forecast cévenol flash floods, which have caused casualties and huge damage in France over the last 20 years. The work was performed in the framework of the Bassin Versant Numérique Expérimental Gardon project, initiated by the French Ministry in charge of Sustainable Development. In this context, this work addresses the capability of machine learning to provide flood forecasts in the absence of rainfall forecasts The first part of this manuscript describes the family of functions chosen in the present study - neural networks-, their ability to forecast the behavior of non-linear dynamic processes, their fundamental properties (universal approximation and parsimony), as well as the conventional methods used to prevent overfitting. The second part of this work presents the river under investigation, the Gardon d'Anduze, as well as related hydrological studies. The third part presents the application of two traditional regularization methods: early stopping and weight decay. In order to allow the prediction of very intense floods, an original variable selection method is proposed: “partial cross validation”. After careful variable and model selection, the ability of models, obtained by either regularization method, to predict the most dramatic event of the database (September 2002) is assessed, thereby allowing an early warning of the populations. Thus, this work demonstrates that, in contrast to statements found in many publications on neural networks applied to flash-flood forecasting, the prediction of an event that is more intense than the events present in the database is feasible, provided a rigorous methodology is used. For this reason, this work opens the way to making current models more adaptive, and to applying the method to ungauged basins.
Flash floods – Forecasting – Neural networks – Regularization