Détection d'erreurs transitoires survenant dans des architectures digitales par une approche logicielle : principes et résultats expérimentaux - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2002

A Software Approach for the Detection of Transient Errors Occurring in Processor-based Digital Architectures: Principles and Experimental Results

Détection d'erreurs transitoires survenant dans des architectures digitales par une approche logicielle : principes et résultats expérimentaux

Résumé

This thesis is devoted to the study of a software methodology for detection of the errors induced by the radioactive environment: the SEU phenomenon, also called upset - which may modify the content of memory elements as the result of the silicon ionization resulting from the impact of a charged particles. The consequences of the upsets for a given application depend on both the occurrence instant and the perturbed memory element, and can go from erroneous results to system crashes which may provoke the loose of the control of a space vehicle.
The proposed software approach is based on the transformation of the programs, written in any high-level language in such a way they have capabilities to detect transient errors affecting data and code. The software modifications are achieved through the application of a set of transformation rules derived from a through analysis of an existing set of rules formerly proposed in the specialized literature. The new set of rules improved the system performances in terms of reducing the number of errors escaping the detection mechanism and the program execution time.
The evaluation of this methodology was carried out by fault injection experiments and the radiation campaigns for several processors. These experiments confirmed our expectations: the hardened version of the application allows a high the error detection rate (average of 88% of the errors which have occurred in the system).
Future works will constitute the base for the definition of a mixed technique software/hardware for the error detection.
Cette thèse est consacrée à l'étude d'une méthodologie logicielle pour la détection d'erreurs induites par l'environnement radiatif : le phénomène dit SEU ou upset qui se traduit par le basculement intempestif du contenu d'un élément mémoire comme conséquence de l'ionisation produite par le passage d'une particule chargée avec le matériel. Les conséquences de ce phénomène dépendent de l'instant d'occurrence et de l'élément mémoire affecté et peuvent aller de la une simple erreur de résultat à la perte de contrôle d'un engin spatial.
La méthodologie repose sur des transformations du programme d'application introduisant des redondances aussi bien au niveau des données que dans le code du programme. Cette méthodologie est basée sur un ensemble de règles permettant la transformation automatique d'une application logicielle en une nouvelle possédant des capacités de détection d'erreurs de type SEU, tout en ayant la même fonctionnalité que l'application originale. L'ensemble de règles est issu d'une analyse approfondie de celles d'une méthode existante, ce dans le but d'améliorer la capacité de détection (réduction de nombre de fautes qui échappent au mécanisme de détection adopté) tout en minimisant le temps d'exécution et l'occupation mémoire du programme transformé. Cette méthodologie a constitué le cadre conceptuel pour la construction d'un outil de génération automatique des programmes tolérants aux erreurs induits par l'environnement radiatif.
L'évaluation de notre méthodologie a été effectuée par des expériences d'injection de fautes et des essais de radiations sur plusieurs processeurs. Ces expérimentations ont confirmé nos attentes : la version tolérante aux fautes d'une application, permet la détection en moyenne de 88% des erreurs survenues.
En terme de perspectives, ce travail de recherche constituera la base pour la définition d'une méthodologie logicielle/matérielle pour la détection d'erreurs.
Fichier principal
Vignette du fichier
tel-00002944.pdf (533.35 Ko) Télécharger le fichier
Loading...

Dates et versions

tel-00002944 , version 1 (04-06-2003)

Identifiants

  • HAL Id : tel-00002944 , version 1

Citer

B. Nicolescu. Détection d'erreurs transitoires survenant dans des architectures digitales par une approche logicielle : principes et résultats expérimentaux. Autre [cs.OH]. Institut National Polytechnique de Grenoble - INPG, 2002. Français. ⟨NNT : ⟩. ⟨tel-00002944⟩

Collections

UGA CNRS TIMA
114 Consultations
372 Téléchargements

Partager

Gmail Facebook X LinkedIn More