Détection d'anomalies à la volée dans des flux de données de grande dimension

Résumé : Le thème principal de cette thèse est d'étudier la détection d'anomalies dans des flux de données de grande dimension avec une application spécifique au \emph{Health Monitoring} des moteurs d'avion. Dans ce travail, on considère que le problème de la détection d'anomalies est un problème d'apprentissage non supervisée. Les données modernes, notamment celles issues de la surveillance des systèmes industriels sont souvent des flux d'observations de grande dimension, puisque plusieurs mesures sont prises à de hautes fréquences et à un horizon de temps qui peut être infini. De plus, les données peuvent contenir des anomalies (pannes) du système surveillé. La plupart des algorithmes existants ne peuvent pas traiter des données qui ont ces caractéristiques. Nous introduisons d'abord un algorithme de clustering probabiliste offline dans des sous-espaces pour des données de grande dimension qui repose sur l'algorithme d'espérance-maximisation (EM) et qui est, en plus, robuste aux anomalies grâce à la technique du trimming. Ensuite, nous nous intéressons à la question du clustering probabiliste online de flux de données de grande dimension en développant l'inférence online du modèle de mélange d'analyse en composantes principales probabiliste. Pour les deux méthodes proposées, nous montrons leur efficacité sur des données simulées et réelles, issues par exemple des moteurs d'avion. Enfin, nous développons une application intégrée pour le Health Monitoring des moteurs d'avion dans le but de détecter des anomalies de façon dynamique. Le système proposé introduit des techniques originales de détection et de visualisation d'anomalies reposant sur les cartes auto-organisatrices. Des résultats de détection sont présentés et la question de l'identification des anomalies est aussi discutée.
Type de document :
Thèse
Statistiques [math.ST]. Université Panthéon-Sorbonne - Paris I, 2014. Français
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00944263
Contributeur : Anastasios Bellas <>
Soumis le : lundi 10 février 2014 - 14:17:02
Dernière modification le : samedi 7 février 2015 - 21:38:15
Document(s) archivé(s) le : dimanche 11 mai 2014 - 04:37:27

Fichier

Identifiants

  • HAL Id : tel-00944263, version 1

Citation

Anastasios Bellas. Détection d'anomalies à la volée dans des flux de données de grande dimension. Statistiques [math.ST]. Université Panthéon-Sorbonne - Paris I, 2014. Français. 〈tel-00944263〉

Partager

Métriques

Consultations de la notice

953

Téléchargements de fichiers

588