Skip to Main content Skip to Navigation
Theses

Sparse high dimensional regression in the presence of colored heteroscedastic noise: application to M/EEG source imaging

Mathurin Massias 1
1 PARIETAL - Modelling brain structure, function and variability based on high-field MRI data
Inria Saclay - Ile de France, NEUROSPIN - Service NEUROSPIN
Résumé : La compréhension du fonctionnement du cerveau est un des défis majeurs du XXIème siècle. Au cours des dernières années, l'imagerie médicale a radicalement transformé les neurosciences. Parmi les techniques d'imagerie cérébrale, la magnéto- et l'électro-encéphalographie se distinguent pour deux raisons: leur faible degré d'invasivité, et leur excellente résolution temporelle. La reconstruction de l'activité neuronale à partir de l'enregistrements des champs électriques et magnétiques constitue ce qu'on appelle le problème inverse bio-magnétique. A cause du petit nombre de capteurs, ce problème inverse est extrêmement mal posé, et il est nécessaire d'ajouter des contraintes pour le résoudre. Une approche populaire, qui est considérée dans ce manuscript, est de postuler que la solution est parcimonieuse spatialement: seul un petit nombre de régions cérébrales sont activées lors d'une tâche cognitive simple et spécifique. Des solutions présentant un tel caractère parcimonieux peuvent notamment être obtenues par une régression linéaire avec pénalité L2/1. Cependant, ce type de régularisation nécessite de résoudre des problèmes d'optimisation non-lisses en grande dimension, avec des méthodes itératives dont la performance se dégrade avec la dimension. De plus, les enregistrements M/EEG sont typiquement corrompus par un fort bruit coloré, allant à l'encontre des hypothèses classiques pour la résolution des problèmes inverses. Il est usuel de blanchir les données avant de les utiliser, et de moyenner plusieurs répétitions d'une même expérience pour augmenter le rapport signal-à-bruit. Dans cette thèse, nous proposons d'abord une accélération des algorithmes itératifs utilisés pour résoudre le problème bio-magnetique avec régularisation L2/1. Les améliorations classiques (règles de filtrage et ensemble actifs), tirent parti de la parcimonie de la solution: elles identifient et ignorent les sources cérébrales inactives, et réduisent ainsi la dimension du problème. Nous introduisons une nouvelle technique d'ensemble actifs, reposant sur les règles de filtrage les plus performantes actuellement. Dans ce cadre, nous proposons des techniques duales avancées, qui permettent un contrôle plus fin de l'optimalité et améliorent les techniques d'identification de prédicteurs. Notre construction duale extrapole la structure Vectorielle Autoregressive des itérés duaux, régularité que nous relions aux propriétés d'identification de support des algorithmes proximaux. En plus du problème inverse bio-magnétique, l'approche proposée est appliquée à l'ensemble des modèles linéaires généralisés régularisés L1. Deuxièmement, nous introduisons de nouveaux estimateurs concomitants pour la régression multitâche. En plus de l'activité cérébrale, ces estimateurs calculent aussi la covariance du bruit. Ils sont conçus pour traiter du bruit gaussien corrélé et exploiter le caractère multirépétition des expériences M/EEG. Le problème d'optimisation sous-jacent est convexe, et présente une structure "lisse + proximable" attrayante. Il est donc résoluble via des techniques standard d'optimisation alternée, pour lesquelles les améliorations présentées dans la première partie s'appliquent. Nous lions la formulation de notre problème au lissage des normes de Schatten. Nous démontrons les bénéfices de notre approche sur des données réelles. Les approches algorithmiques et la modélisation du bruit proposées ourent la voie à une analyse des singaux M/EEG plus rapide et plus efficace statistiquement, permettant ainsi une analyse interactive des enregistrements par les praticiens, et des analyses passant à l'échelle de la taille croissante des jeux de données M/EEG modernes.
Complete list of metadatas

Cited literature [200 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-02401628
Contributor : Mathurin Massias <>
Submitted on : Monday, January 20, 2020 - 11:25:17 AM
Last modification on : Monday, February 10, 2020 - 6:13:44 PM

File

thesis_tel.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-02401628, version 2

Citation

Mathurin Massias. Sparse high dimensional regression in the presence of colored heteroscedastic noise: application to M/EEG source imaging. Machine Learning [stat.ML]. Telecom Paristech, 2019. English. ⟨tel-02401628v2⟩

Share

Metrics

Record views

220

Files downloads

167