Machine learning for neuroimaging using a very large scale clinical datawarehouse

Simona Bottani

Résumé

Machine learning (ML) and deep learning (DL) have been widely used for the computer-aided diagnosis (CAD) of neurodegenerative diseases The main limitation of these tools is that they have been mostly validated using research data sets that are very different from clinical routine ones: strict image acquisition protocols ensure good quality and homogeneous data, and well-defined diagnostic criteria guarantee unambiguous classification tasks. The validation on large clinical data sets is necessary to understand the performance of these tools in a real setting. Clinical data warehouses (CDW), gathering data of hundred of thousands of patients from different hospitals, allow access to such clinical data. This PhD work consisted in applying ML/DL algorithms to data originating from the CDW of the Greater Paris area (Assistance Publique-Hôpitaux de Paris [AP-HP]) to validate CAD of neurodegenerative diseases. In particular, we aimed to address some of the challenges posed by the use of this type of data. In the first work we developed, thanks to the manual annotation of 5500 images, an automatic approach for the quality control (QC) of T1-weighted (T1w) brain magnetic resonance images (MRI) from a clinical data set. QC is fundamental as insufficient image quality can prevent CAD systems from working properly. The automatic QC was able to identify images that are not proper T1w brain MRIs, to identify acquisitions for which gadolinium was injected and to rate the overall image quality. In the second work, we focused on the homogenization of T1w brain MRIs from a CDW: heterogeneity must be reduced to avoid potential biases in downstream tasks. We proposed to homogenize such large clinical data set by converting images acquired after the injection of gadolinium into non-contrast-enhanced images using 3D U-Net models and conditional generative adversarial networks. Lastly, we assessed whether ML/DL algorithms could detect dementia in a CDW using T1w brain MRI. We identified the population of interest using ICD-10 codes assigned during hospitalization. We compared the ability of ML/DL algorithms to detect dementia patients in a research data set and in the AP-HP CDW set. We then studied how the imbalance of the training sets, in terms of contrast injection and image quality, may bias the results and we proposed strategies to attenuate these biases. CDW offer fantastic opportunities for the translation of CAD systems from research to clinical practice, but they still pose considerable challenges.

L'apprentissage automatique et l'apprentissage profond ont été largement utilisés pour le diagnostic assisté par ordinateur des maladies neurodégénératives. La principale limite de ces outils est qu'ils ont été validés en utilisant des données de recherche qui sont très différents des données de routine clinique: les protocoles stricts d'acquisition d'images garantissent des données de bonne qualité et homogènes, et les critères de diagnostic bien définis garantissent des tâches de classification sans ambiguïté. La validation sur de grands ensembles de données cliniques est nécessaire pour comprendre la performance de ces outils dans un contexte réel. Les entrepôts de données de santé (EDS), qui rassemblent les données de centaines de milliers de patients de différents hôpitaux, permettent d'accéder à de telles données. Ce travail de thèse a consisté à appliquer des algorithmes d'apprentissage automatique à des données provenant de l'EDS de l'Assistance Publique-Hôpitaux de Paris (AP-HP) pour valider les outils pour le diagnostic assisté par ordinateur de maladies neurodégénératives. En particulier, nous avons cherché à relever certains des défis posés par l'utilisation de ce type de données. Dans le premier travail, nous avons développé, grâce à l'annotation manuelle de 5500 images, une approche automatique pour le contrôle qualité des images par résonance magnétique (IRM) cérébrales pondérées en T1 provenant d'un EDS. Le contrôle qualité est fondamental car une qualité d'image insuffisante peut empêcher les systèmes de fonctionner correctement. Le contrôle qualité automatique a permis d'identifier les images qui ne sont pas de véritables IRM cérébrales pondérées en T1, d'identifier les acquisitions pour les quelles du gadolinium a été injecté et d'évaluer la qualité globale de l'image. Dans le second travail, nous nous sommes concentrés sur l'homogénéisation des IRM cérébrales pondérées en T1 provenant d'un EDS : l'hétérogénéité doit être réduite pour éviter les biais potentiels dans les tâches en aval. Nous avons proposé d'homogénéiser ce grand ensemble de données cliniques en convertissant les images acquises après l'injection de gadolinium en images sans contraste à l'aide de modèles U-Net 3D et de réseaux antagonistes génératifs conditionnels. Enfin, nous avons évalué si les algorithmes d'apprentissage automatique pouvaient détecter la démence dans un EDS en utilisant l'IRM cérébrale pondérées en T1. Nous avons identifié la population d'intérêt grace aux codes CIM-10 attribués pendant l'hospitalisation. Nous avons comparé la capacité des algorithmes à détecter les patients atteints de démence dans un ensemble de données de recherche et dans l'ensemble de l'EDS de l'AP-HP. Nous avons ensuite étudié comment le déséquilibre des ensembles d'entraînement, en termes d'injection de produit de contraste et de qualité d'image, peuvent biaiser les résultats et nous avons proposé des stratégies pour atténuer ces biais. Les EDS offrent des possibilités fantastiques pour faire passer les systèmes d'aide au diagnostic de la recherche à la pratique clinique, mais ils posent encore des défis considérables.

Machine learning for neuroimaging using a very large scale clinical datawarehouse

Apprentissage automatique pour la neuro-imagerie à l'aide d'un entrepôt de données cliniques à très grande échelle

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Partager