Applications of large randommatrix to high dimensional statistical signal processing

Résumé : Cette thèse porte sur des problèmes de statistiques mettant en jeu une série temporelle multivariable ${\bf y}_n$ de grande dimension $M$ définie comme la somme d'un bruit gaussien blanc temporellement et spatialement et d'un signal utile généré comme la sortie d'un filtre $1$ entrée / $M$ sorties à réponse impulsionnelle finie excité par une séquence déterministe scalaire non observable. Si l'on suppose que ${\bf y}$ est observé entre les instants $1$ et $N$, un bon nombre de techniques existantes sont basées sur des fonctionnelles de la matrice de covariance empirique $\hat{{\bf R}}_L$ des vecteurs de dimensions $ML$ $({\bf y}_n^{(L)})_{n=1, \ldots, N}$ obtenus en empilant les vecteurs ${\bf y}_k$ entre les instants $n$ et $n+L-1$, où $L$ est un paramètre bien choisi. Lorsque l'on est en mesure de collecter un nombre d'observations très nettement plus grand que la dimension $ML$ des vecteurs $({\bf y}_n^{(L)})_{n=1, \ldots, N}$, $\hat{{\bf R}}_L$ a le même comportement en norme spectrale que son espérance mathématique, et cela permet d'étudier les techniques d'inférences basés sur $\hat{{\bf R}}_L$ par le biais de techniques classiques de statistique asymptotique. Dans cette thèse, nous nous intéressons au cas où $ML$ et $N$ sont du même ordre de grandeur, ce que nous modélisons par des régimes asymptotiques dans lesquels $M$ et $N$ tendent tous les deux vers l'infini, et où le rapport $ML/N$ converge vers une constante non nulle, $L$ pouvant aussi croître avec $M$ et $N$. Les problèmes que nous résolvons dans ce travail nécessitent d'étudier le comportement des éléments propres de la grande matrice aléatoire $\hat{{\bf R}}_L$. Compte tenu de la structure particulière des vecteurs $({\bf y}_n^{(L)})_{n=1, \ldots, N}$, $\hat{{\bf R}}_L$ co\"{\i}ncide avec la matrice de Gram d'une matrice Hankel par bloc $\boldsymbol{\Sigma}_L$, et cette spécificité nécessite le développement de techniques appropriées. Dans le chapitre 2, nous nous intéressons au cas où le nombre de coefficients $P$ de la réponse impulsionnelle générant le signal utile et le paramètre $L$ restent fixes quand $M$ et $N$ grandissent. La matrice $\boldsymbol{\Sigma}_L$ est alors une perturbation de rang fini de la matrice Hankel par bloc ${\bf W}_{L}$ constituée à partir du bruit additif. Nous montrons que les éléments propres de $\hat{{\bf R}}_L$ se comportent comme si la matrice ${\bf W}_{L}$ était à éléments indépendants et identiquement distribués. Cela nous permet d'aborder l'étude de tests de détection du signal utile portant sur les plus grandes valeurs propres de $\hat{{\bf R}}_L$ ainsi que la mise en évidence de nouvelles stratégies de détermination du paramètre de régularisation de filtres de Wiener spatio-temporels estimés à partir d'une séquence d'apprentissage. Techniquement, ce dernier point est abordé en caractérisant le comportement asymptotique des éléments de la résolvente de la matrice $\hat{{\bf R}}_L$. Nous montrons enfin également que ces résultats permettent d'analyser le comportement d'algorithmes sous-espace de localisation de sources bande étroite utilisant la technique du lissage spatial. Dans le chapitre 3, motivés par le cas où $P$ et $L$ peuvent tendre vers l'infini, nous nous écartons quelque peu du modèle initial, et supposons que la matrice $\boldsymbol{\Sigma}_{L}$ est la somme de la matrice aléatoire Hankel par bloc ${\bf W}_{L}$ avec une matrice déterministe sans structure particulière. En utilisant des approches basées sur la transformée de Stieltjes et des outils adaptés au caractère gaussien du bruit, nous montrons que la distribution empirique des valeurs propres de $\hat{{\bf R}}_L$ a un comportement déterministe que nous caractérisons. Sous réserve $L^{2}/MN$ tende vers $0$, nous faisons de même pour les éléments de la résolvante de $\hat{{\bf R}}_L$. Dans le chapitre 4, nous revenons au modèle initial, mais supposons que $P$ et $L$ tendent vers l'infini au même rythme. Dans ce contexte, la contribution du signal utile à la matrice $\boldsymbol{\Sigma}_{L}$ est une matrice dont le rang tend vers l'infini, et les techniques utilisées dans le chapitre 2 ne sont plus applicables. En utilisant les résultats du chapitre 3, nous établissons que si $L^{2}/MN$ tende vers $0$, les éléments de la résolvante de $\hat{{\bf R}}_L$ se comportent comme les éléments d'une matrice déterministe qui co\"{\i}ncide avec l'équivalent déterministe de la resolvente d'un modèle information plus bruit dans lequel les éléments de la matrice de bruit sont indépendants et identiquement distribués. Dans le cas où $L/M$ tend vers $0$, ceci nous permet d'étendre les résultats du chapitre 2 relatifs à la détermination du paramètre de régularisation des filtres de Wiener spatio-temporels estimés à partir d'une séquence d'apprentissage.
Type de document :
Thèse
Statistics [math.ST]. Université Paris Est Marne la Vallée, 2017. English
Liste complète des métadonnées

Littérature citée [85 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01712290
Contributeur : Gia-Thuy Pham <>
Soumis le : lundi 19 février 2018 - 12:43:39
Dernière modification le : mercredi 11 avril 2018 - 12:12:03
Document(s) archivé(s) le : dimanche 6 mai 2018 - 16:38:24

Fichier

Thesis_Gia-Thuy.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01712290, version 1

Collections

Citation

Gia-Thuy Pham. Applications of large randommatrix to high dimensional statistical signal processing. Statistics [math.ST]. Université Paris Est Marne la Vallée, 2017. English. 〈tel-01712290〉

Partager

Métriques

Consultations de la notice

66

Téléchargements de fichiers

32