Skip to Main content Skip to Navigation
Theses

Ensembles of models in fMRI : stable learning in large-scale settings

Résumé : En imagerie médicale, des collaborations internationales ont lançé l'acquisition de centaines de Terabytes de données - et en particulierde données d'Imagerie par Résonance Magnétique fonctionelle (IRMf) -pour les mettre à disposition de la communauté scientifique.Extraire de l'information utile de ces données nécessite d'importants prétraitements et des étapes de réduction de bruit. La complexité de ces analyses rend les résultats très sensibles aux paramètres choisis. Le temps de calcul requis augmente plus vite que linéairement: les jeux de données sont si importants qu'il ne tiennent plus dans le cache, et les architectures de calcul classiques deviennent inefficaces.Pour réduire les temps de calcul, nous avons étudié le feature-grouping commetechnique de réduction de dimension. Pour ce faire, nous utilisons des méthodes de clustering. Nous proposons un algorithme de clustering agglomératif en temps linéaire: Recursive Nearest Agglomeration (ReNA). ReNA prévient la création de clusters énormes, qui constitue un défaut des méthodes agglomératives rapidesexistantes. Nous démontrons empiriquement que cet algorithme de clustering engendre des modèles très précis et rapides, et permet d'analyser de grands jeux de données avec des ressources limitées.En neuroimagerie, l'apprentissage statistique peut servir à étudierl'organisation cognitive du cerveau. Des modèles prédictifs permettent d'identifier les régions du cerveau impliquées dans le traitement cognitif d'un stimulus externe. L'entraînement de ces modèles est un problème de très grande dimension, et il est nécéssaire d'introduire un a priori pour obtenir un modèle satisfaisant.Afin de pouvoir traiter de grands jeux de données et d'améliorer lastabilité des résultats, nous proposons de combiner le clustering etl'utilisation d'ensembles de modèles. Nous évaluons la performance empirique de ce procédé à travers de nombreux jeux de données de neuroimagerie. Cette méthode est hautement parallélisable et moins coûteuse que l'état del'art en temps de calcul. Elle permet, avec moins de données d'entraînement,d'obtenir de meilleures prédictions. Enfin, nous montrons que l'utilisation d'ensembles de modèles améliore la stabilité des cartes de poids résultantes et réduit la variance du score de prédiction.
Complete list of metadatas

Cited literature [174 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01526693
Contributor : Abes Star :  Contact
Submitted on : Tuesday, May 23, 2017 - 1:36:10 PM
Last modification on : Monday, February 10, 2020 - 6:13:43 PM
Document(s) archivé(s) le : Friday, August 25, 2017 - 12:59:28 AM

File

75820_HOYOS_IDROBO_2017_diffus...
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01526693, version 1

Citation

Andrés Hoyos-Idrobo. Ensembles of models in fMRI : stable learning in large-scale settings. Medical Imaging. Université Paris-Saclay, 2017. English. ⟨NNT : 2017SACLS029⟩. ⟨tel-01526693⟩

Share

Metrics

Record views

904

Files downloads

673