A robust & reliable Data-driven prognostics approach based on extreme learning machine and fuzzy clustering. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2014

A robust & reliable Data-driven prognostics approach based on extreme learning machine and fuzzy clustering.

Résumé

Prognostics & Health Management (PHM) aims at extending the life cycle of an engineering asset, while reducing exploitation and maintenance costs. For this reason, prognostics is considered as a key process with future capabilities. Indeed, accurate estimates of the Remaining Useful Life (RUL) of equipment enable defining further plan of actions to increase safety, minimize downtime, ensure mission completion and efficient production. Recent advances show that data-driven approaches (mainly from machine learning) are increasingly applied for fault prognostics. They can be seen as black-box models that learn the system behavior directly from Condition Monitoring (CM) data, use that knowledge to infer its current state and predict future progression of failure. However, approximating the behavior of critical machinery is a challenging task that can result in poor prognostics. As for understanding some issues of data-driven prognostics modeling, consider the following points. 1) How to effectively process raw monitoring data to obtain suitable features that clearly reflect evolution of degradation? 2) How to discriminate degradation states and define failure criteria (that can vary from case to case)? 3) How to be sure that learned-models will be robust enough to show steady performance over uncertain inputs that deviate from learned experiences, and to be reliable enough to encounter unknown data (i.e. operating conditions, engineering variations, etc.)? 4) How to achieve ease of application under industrial constraints and requirements? Such issues constitute the problems addressed in this thesis and have led to develop a novel approach beyond conventional methods of data-driven prognostics. Main contributions are as follows.
- The data-processing step is improved by introducing a new approach for features extraction using trigonometric and cumulative functions, where features selection is based on three characteristics, i.e., monotonicity, trendability and predictability. The main idea of this development is to transform raw data into features that improve accuracy of long-term predictions.
- To account for robustness, reliability and applicability issues, a new prediction algorithm is proposed: the Summation Wavelet-Extreme Learning Machine (SWELM). SW-ELM ensures good prediction performances while reducing the learning time. An ensemble of SW-ELM is also proposed to quantify uncertainty and improve accuracy of estimates.
- Prognostics performances are also enhanced thanks to the proposition of a new health assessment algorithm: the Subtractive-Maximum Entropy Fuzzy Clustering (S-MEFC). S-MEFC is an unsupervised classification approach which uses maximum entropy inference to represent uncertainty of unlabeled multi-dimensional data and can automatically determine the number of states (clusters), i.e., without human assumption.
- The final prognostics model is achieved by integrating SW-ELM and S-MEFC to show evolution of machine degradation with simultaneous predictions and discrete state estimation. This scheme also enables to dynamically set failure thresholds and to estimate the RUL of monitored machinery. Developments are validated on real data from three experimental platforms: PRONOSTIA FEMTO-ST (bearings test-bed), CNC SIMTech (machining cutters), C-MAPSS NASA (turbofan engines) and other benchmark data. Due to realistic nature of the proposed RUL estimation strategy, quite promising results are achieved. However, reliability of the Prognostics model still needs to be improved which is the main perspective of this work.
Le Pronostic et l'étude de l'état de santé (en anglais Prognostics and Health Management (PHM)) vise à étendre le cycle de vie d'un actif physique, tout en réduisant les coûts d'exploitation et de maintenance. Pour cette raison, le pronostic est considéré comme un processus clé avec des capacités de prédictions. En effet, des estimations précises de la durée de vie avant défaillance d'un équipement, Remaining Useful Life (RUL), permettent de mieux définir un plan d'actions visant à accroître la sécurité, réduire les temps d'arrêt, assurer l'achèvement de la mission et l'efficacité de la production. Des études récentes montrent que les approches guidées par les données sont de plus en plus appliquées pour le pronostic de défaillance. Elles peuvent être considérées comme des modèles de type " boite noire " pour l'étude du comportement du système directement à partir des données de surveillance d'état, pour définir l'état actuel du system et prédire la progression future de défauts. Cependant, l'approximation du comportement des machines critiques est une tâche difficile qui peut entraîner des mauvais pronostics. Pour la compréhension de la modélisation de pronostic guidé par les données, on considère les points suivants. 1) Comment traiter les données brutes de surveillance pour obtenir des caractéristiques appropriées reflétant l'évolution de la dégradation ? 2) Comment distinguer les états de dégradation et définir des critères de défaillance (qui peuvent varier d'un cas à un autre)? 3) Comment être sûr que les modèles définis seront assez robustes pour montrer une performance stable avec des entrées incertaines s'écartant des expériences acquises, et seront suffisamment fiables pour intégrer des données inconnues (c'est à dire les conditions de fonctionnement, les variations de l'ingénierie, etc.)? 4) Comment réaliser facilement une intégration sous des contraintes et des exigences industrielles? Ces questions sont des problèmes abordés dans cette thèse. Elles ont conduit à développer une nouvelle approche allant au-delà des limites des méthodes classiques de pronostic guidé par les données. Les principales contributions sont les suivantes.
- L'étape de traitement des données est améliorée par l'introduction d'une nouvelle approche d'extraction des caractéristiques à l'aide de fonctions trigonométriques et cumulatives qui sont basées sur trois caractéristiques : la monotonie, la "trendability" et la prévisibilité. L'idée principale de ce développement est de transformer les données brutes en indicateur qui améliorent la précision des prévisions à long terme.
- Pour tenir compte de la robustesse, la fiabilité et l'applicabilité, un nouvel algorithme de prédiction est proposé: Summation Wavelet-Extreme Learning Machine (SWELM). Le SW-ELM assure de bonnes performances de prédiction, tout en réduisant le temps d'apprentissage. Un ensemble de SW-ELM est également proposé pour quantifier l'incertitude et améliorer la précision des estimations.
- Les performances du pronostic sont également renforcées grâce à la proposition d'un nouvel algorithme d'évaluation de la santé: Subtractive-Maximum Entropy Fuzzy Clustering (S-MEFC). S-MEFC est une approche de classification non supervisée qui utilise l'inférence de l'entropie maximale pour représenter l'incertitude de données multidimensionnelles. Elle peut automatiquement déterminer le nombre d'états, sans intervention humaine.
- Le modèle de pronostic final est obtenu en intégrant le SW-ELM et le S-MEFC pour montrer l'évolution de la dégradation de la machine avec des prédictions simultanées et l'estimation d'états discrets. Ce programme permet également de définir dynamiquement les seuils de défaillance et d'estimer le RUL des machines surveillées. Les développements sont validés sur des données réelles à partir de trois plates-formes expérimentales: PRONOSTIA FEMTO-ST (banc d'essai des roulements), CNC SIMTech (Les fraises d'usinage), C-MAPSS NASA (turboréacteurs) et d'autres données de référence. En raison de la nature réaliste de la stratégie d'estimation du RUL proposée, des résultats très prometteurs sont atteints. Toutefois, la perspective principale de ce travail est d'améliorer la fiabilité du modèle de pronostic.
Fichier principal
Vignette du fichier
These_Kamran_Javed_As2M.pdf (6.8 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01025295 , version 1 (21-07-2014)

Identifiants

  • HAL Id : tel-01025295 , version 1

Citer

Kamran Javed. A robust & reliable Data-driven prognostics approach based on extreme learning machine and fuzzy clustering.. Automatic. Université de Franche-Comté, 2014. English. ⟨NNT : ⟩. ⟨tel-01025295⟩
1222 Consultations
2288 Téléchargements

Partager

Gmail Facebook X LinkedIn More