Développement de nouvelles méthodes d’homogénéisation des données atmosphériques GNSS. Application à l’étude de la variabilité climatique. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

Developement of new homogenisation methods for atmospheric GNSS data. Application to the analysis of climate trends and variability

Développement de nouvelles méthodes d’homogénéisation des données atmosphériques GNSS. Application à l’étude de la variabilité climatique.

Annarosa Quarello
  • Fonction : Auteur
  • PersonId : 1161910
  • IdRef : 264190327

Résumé

Homogenization is an important and crucial step to improve the use of observational data for climate analysis. This work is motivated by the analysis of long GNSS Integrated Water Vapor (IWV) data which have not yet been used in this context. These series are affected by inhomogeneities linked to changes in the instrumentation, in the environment, and in the data processing procedure. Due to the natural variability of the series we actually work on the time series of differences, using ERA-Interim reanalysis as reference for the climate signal. A base assumption is that the differences contain only the signature of the abrupt changes from the GNSS series which can be detected by means of a segmentation algorithm. Careful analysis of the segmentation results allows to sort the cases when this assumption is actually not true. The main contribution of this thesis was the development a novel segmentation method dedicated to detecting changes in the mean of the GNSS-ERA-Interim IWV difference series. This segmentation model integrates a periodic bias and a heterogeneous, monthly varying, variance to properly fit the characteristics of the series. The method consists of first estimating the variance using a robust estimator and then estimating the segmentation parameters (the positions of the change-points, the means of the segments) and the periodic bias model in a sequential way. The segmentation parameters and the periodic bias model are estimated iteratively for a fixed number of change-points. The inference is achieved by the classical maximum likelihood procedure using the dynamic programming algorithm for the estimation of the segmentation parameters which provides the exact solution in a reasonable amount of time. The procedure is repeated for all the numbers of change-points tested between 0 and a maximum (about 30). Finally, the optimal number of change-points is chosen using a penalized model selection strategy. Several criteria are tested. The method is implemented in the R GNSSseg package available on CRAN. The performance of the proposed method was evaluated by numerical simulations. An application for a real dataset of 120 global GNSS stations in the global IGS network is presented for the period from January 1995 to December 2010. Inspection of the results reveals that the detected change-points contain a fraction (~ 20 %) of outliers which are characterized by double detections with two large offsets, generally of opposite signs, close together, e.g. a few tens of days apart. In order to detect and eliminate the outliers a screening method was developed. The final set of change-points is validated with respect to GNSS metadata which contain information on equipment changes that occurred at the stations. The percentage of validation remains moderate at the level of 20 % despite all the changes are statistically significant. Some of the change-points may actually be due to the reference series (ERA-Interim). Finally, the segmentation information (dates of the change-points) is included in a linear regression algorithm which is used to estimate the GNSS IWV trends. The estimated trends are tested for significance and compared to the ERA-Interim trends. Higher spatial consistency in the GNSS trends and improved consistency is found after homogenisation with ERA-Interim in regions where the reanalysis is known to perform well. [...]
L'homogénéisation est une étape importante et cruciale pour améliorer l'utilisation des données d'observation pour l'analyse du climat. Ce travail est motivé par l'analyse de les données journalières de Contenu Intégré en Vapeur d’Eau (CIVE) mesurées par GNSS (Global Navigation Satellite Systems), appelées GNSS CIVE (IWV Integrated Water Vapor en anglais) qui n'ont pas encore été utilisées dans ce contexte. Ces séries sont affectées par des inhomogénéités liées à des changements dans l'instrumentation, dans l'environnement et dans la procédure de traitement des données. En raison de la variabilité naturelle de la série, nous travaillons en fait sur la série chronologique des différences, en utilisant la réanalyse ERA-Interim comme référence pour le signal climatique. Une hypothèse de base est que les différences contiennent seulement la signature des changements brusques de la série GNSS qui peuvent être détectés au moyen d'un algorithme de segmentation. Une analyse minutieuse des résultats de la segmentation permet de trier les cas où cette hypothèse n'est en fait pas vraie. La principale contribution de cette thèse a été le développement d'une nouvelle méthode de segmentation dédiée à la détection des changements dans la moyenne de la série de différences GNSS-ERA-Interim CIVE. Ce modèle de segmentation intègre un biais périodique et une variance hétérogène, variable mensuellement, pour s'adapter correctement aux caractéristiques de la série. La méthode consiste à estimer d'abord la variance à l'aide d'un estimateur robuste puis à estimer les paramètres de segmentation (les positions des points de changement, les moyennes des segments) et le modèle de biais périodique de manière séquentielle. Les paramètres de segmentation et le modèle de biais périodique sont estimés de manière itérative pour un nombre fixe de points de changement. L'inférence est obtenue par la procédure classique du maximum de vraisemblance en utilisant l'algorithme de programmation dynamique pour l'estimation des paramètres de segmentation qui fournit la solution exacte dans un laps de temps raisonnable. La procédure est répétée pour tous les nombres de points de changement testés entre 0 et un maximum (environ 30). Enfin, le nombre optimal de points de changement est choisi en utilisant une stratégie de sélection de modèle pénalisée. Plusieurs critères sont testés. La méthode est implémentée dans le package R GNSSseg disponible sur CRAN. Les performances de la méthode proposée ont été évaluées par des simulations numériques. Une application pour un ensemble de données réel de 120 stations GNSS mondiales dans le réseau mondial IGS est présentée pour la période de janvier 1995 à décembre 2010. L'inspection des résultats révèle que les points de changement détectés contiennent une fraction (~20%) de valeurs aberrantes qui se caractérisent par des détections doubles avec deux grands décalages, généralement de signes opposés, rapprochés, p.ex. à quelques dizaines de jours d'intervalle. Afin de détecter et d'éliminer les valeurs aberrantes, une méthode de dépistage a été développée. L'ensemble final de points de changement est validé par rapport aux métadonnées GNSS qui contiennent des informations sur les changements d'équipement survenus dans les stations. Le pourcentage de validation reste modéré au niveau de 20% malgré tous les changements sont statistiquement significatifs. Certains des points de changement peuvent en fait être dus à la série de référence (ERA-Interim). Enfin, les informations de segmentation (dates des points de changement) sont incluses dans un algorithme de régression linéaire qui est utilisé pour estimer les tendances GNSS CIVE. Les tendances estimées sont testées pour leur signification et comparées aux tendances ERA-Interim. Une plus grande cohérence spatiale dans les tendances GNSS et une meilleure cohérence sont trouvées après l'homogénéisation avec ERA-Interim dans les régions où la réanalyse est connue pour ses performances...
Fichier principal
Vignette du fichier
QUARELLO_Annarosa_2020.pdf (18.6 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03771164 , version 1 (22-01-2021)
tel-03771164 , version 2 (07-09-2022)

Identifiants

  • HAL Id : tel-03771164 , version 2

Citer

Annarosa Quarello. Développement de nouvelles méthodes d’homogénéisation des données atmosphériques GNSS. Application à l’étude de la variabilité climatique.. Sciences de la Terre. Sorbonne Université, 2020. Français. ⟨NNT : 2020SORUS457⟩. ⟨tel-03771164v2⟩
162 Consultations
46 Téléchargements

Partager

Gmail Facebook X LinkedIn More