Analyse et modélisation de données probabilistes par décomposition de mélange de copules et application à une base de données climatologiques - TEL - Thèses en ligne Access content directly
Theses Year : 2002

Analyse et modélisation de données probabilistes par décomposition de mélange de copules et application à une base de données climatologiques

Abstract

We extend the mixture decomposition of densities methods to the case of data "distribution functions", allowing to classify these functions and to model a probability law for this particular functional data. This law is given by the notion of "distribution of distribution functions" (FDD in French), based on the definition of a distribution function for random variables with values in a probabilistic space. The extensions are realised in associating the FDD to "copulas" functions according to the Sklar's theorem. Copulas joint the multivariate distribution functions (joint) with the univariate distribution functions (margins) for a vector of n random variables. We essentially look at one class of parametric copulas, the Archimedian copulas and we propose three new methods for the estimation of parameters in the multivariate copulas case : with Kendall's rank correlation coefficients, Spearman's coefficient and in maximising the likelihood. The association of the copulas with the FDD, characterises the evolution of the functional data (i.e. the shape of these distribution functions) between different points of the functions inside the classes for each variable, and gives a measure of dependency between the used variables. The methods are first developed for one variable, then several generalisations are proposed for n dimensions. Some theoretical points are discussed, such as the convergence of the algorithm and the fact that the method with copulas is a generalisation of the classical case. An application of the "classification approach" method by copulas is realised on a climate database of the terrestrial atmosphere. The goal is to classify atmospheric "profiles" and to estimate the probability law of these data. The results are compared with those of "classical" methods, showing the performances of our method by mixture decomposition of copulas, and the interest of using probabilistic data.
Nous étendons les méthodes de décomposition de mélange de densités de probabilité au cas des données "fonctions de répartition", permettant ainsi de classifier ces fonctions et de modéliser une loi pour ces données fonctionnelles particulières. Cette loi est donnée par la notion de "fonctions de distribution de distributions" (FDD), basée sur la définition d'une fonction de répartition pour des variables aléatoires à valeurs dans un espace probabiliste. Les extensions sont effectuées en associant les FDD aux fonctions "copules" par le théorème de Sklar. Les copules "couplent" les fonctions de répartition à n dimensions (jointes) et à 1-dimension (marginales) d'un n-uplet de variables aléatoires. Nous regardons principalement une classe de copules paramétriques, les copules Archimédiennes, et proposons trois nouvelles méthodes d'estimation des paramètres dans le cas de copules multivariées : par coefficients de corrélation de Kendall, de Spearman, et par maximisation de la vraisemblance. L'association des FDD et des copules caractérise l'évolution des données fonctionnelles (i.e. la forme de ces fonctions) entre différents points à l'intérieur des classes pour chaque variable, et donne une mesure de dépendance entre les variables utilisées. Les méthodes sont tout d'abord développées pour une variable, puis divers généralisations sont proposées pour n dimensions. Certains points théoriques sont ensuite discutés, tels que la convergence de l'algorithme et le fait que la méthode par copules est une généralisation du cas classique. Une application de la méthode "approche classification" par copules est réalisée sur des données climatiques de l'atmosphère terrestre. Le but est la classification de "profils" atmosphériques et l'estimation de la loi sous-jacente des données. Les résultats sont comparés avec ceux de méthodes "classiques", prouvant ainsi les performances nettement supérieures de la méthode par décomposition de mélange de copules (DMC) et l'intérêt de l'utilisation des données probabilistes.
Fichier principal
Vignette du fichier
tel-00002386.pdf (8.73 Mo) Télécharger le fichier

Dates and versions

tel-00002386 , version 1 (11-02-2003)

Identifiers

  • HAL Id : tel-00002386 , version 1

Cite

Mathieu Vrac. Analyse et modélisation de données probabilistes par décomposition de mélange de copules et application à une base de données climatologiques. Interface homme-machine [cs.HC]. Université Paris Dauphine - Paris IX, 2002. Français. ⟨NNT : ⟩. ⟨tel-00002386⟩
898 View
589 Download

Share

Gmail Facebook X LinkedIn More