Représentation et propagation de connaissances imprécises et incertaines: Application à l'évaluation des risques liés aux sites et sols pollués. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2005

Representation and propagation of imprecise and uncertain knowledge: Application to the assessment of risks related to contaminated sites

Représentation et propagation de connaissances imprécises et incertaines: Application à l'évaluation des risques liés aux sites et sols pollués.

Résumé

Currently, decisions pertaining to the management of potentially polluted sites very often rely on the evaluation of risks for man and the environment. This evaluation is carried out with the help of models which simulate the transfer of pollutants from a source to a vulnerable target, for different scenarios of exposure. The selection of parameter values of these models is based as much as possible on the data collected at the time of on-site investigations (phase of diagnosis). However, due to time and financial constraints, information regarding model parameters is often incomplete and imprecise.
This leads to uncertainty that needs to be accounted for the decision-making process.

Uncertainty regarding model parameters may have essentially two origins. It may arise from randomness due to natural variability resulting from heterogeneity of population or the fluctuations of a quantity in time. Or it may be caused by imprecision due to a lack of information resulting, for example, from systematic measurement errors or expert opinions. In risk assessment, no distinction is traditionally made between these two types of uncertainty, both being represented by means of a single probability distribution.

So, uncertainty in risk assessment models is generally addressed within a purely probabilistic framework. This approach comes down to assuming that knowledge regarding model parameters is always of random nature (variability). Such knowledge is represented by single probability distributions typically propagated through the risk model using the Monte-Carlo technique. Even if this approach is well-known, the difficulty is to avoid an arbitrary choice of the shape of probability distributions asssigned to model parameters.
Indeed in the context of risk assessment
related to pollutant exposure, knowledge of some parameters is often imprecise or incomplete.
The use of single probability distribution to represent this type of knowledge becomes subjective and partly arbitrary, and it is more natural to use intervals.

However, the available information is often richer than an interval but less rich than a probability distribution. In practice, while information regarding variability is best conveyed using probability distributions, information regarding imprecision is more faithfull conveyed using probability families encoded either by p-boxes (lower & upper cumulative distribution functions) or by possibility distributions (also called fuzzy intervals) or yet by random intervals using the belief functions of Dempster-Shafer.

The first objective of this work is to propose practical representation methods according to available information regarding model parameters by using possibility, probability and random sets. The second one is to propose different methods for propagating variability and imprecision information through
risk model by trying to take into account dependency between model parameters. Lastly, these alternative methods are tested on simplified real cases, with a view to provide useful inputs for the decision-making process:

- Dose calculation: Transfer of a radioactive pollutant (strontium) from the deposit to man, through the consumption of food (cow's milk).

- Toxic risk related to the accidental spill of trichloroethylene (TCE) into an aquifer (semi-analytical model).

- Risk for health related to grounds polluted by lead due to the presence of factories.
Actuellement, les choix relatifs à la gestion des sites potentiellement pollués s'appuient, notamment,
sur une évaluation des risques pour l'homme et l'environnement. Cette évaluation est effectuée à l'aide de modèles qui simulent le transfert de polluant depuis une source de pollution vers une cible vulnérable, pour différents scénarii d'exposition. La sélection des valeurs des paramètres de ces modèles s'appuie autant que possible sur les données recueillies lors des investigations de terrain (phase de diagnostic de site). Or pour des raisons de délais et de coûts, l'information recueillie lors de cette phase de diagnostic est toujours incomplète; elle est donc entachée d'incertitude. De même, les modèles de transferts et d'exposition présentent également des incertitudes à intégrer dans les procédures. Cette notion globale d'incertitude doit être prise en compte dans l'évaluation du risque pour que les résultats soient utiles lors la phase décisionnelle.

L'incertitude sur les paramètres peut avoir deux origines. La première provient du caractère aléatoire de l'information due à une variabilité naturelle résultant de phénomènes stochastiques. On parle alors d'incertitudes de variabilité ou d'incertitudes stochastiques. La seconde est liée au caractère imprécis de l'information lié à un manque de connaissance et qui résulte par exemple d'erreurs systématiques lors de mesures ou d'avis d'experts.
On parle alors d'incertitudes épistémiques. Dans le calcul de risque, ces deux notions sont souvent confondues alors qu'elles devraient être traitées de manière différente.

L'incertitude en évaluation des risques a surtout été appréhendée dans un cadre purement probabiliste.
Cela revient à supposer que la connaissance sur les paramètres des modèles est toujours de nature aléatoire (variabilité). Cette approche consiste à représenter les paramètres incertains par des distributions de probabilité uniques et à transmettre l'incertitude relative à ces paramètres sur celle du risque encouru par la cible, en appliquant en général la technique dite Monte Carlo. Si cette approche est bien connue, toute la difficulté tient à une définition cohérente des distributions de probabilité affectées aux paramètres par rapport à la connaissance disponible. En effet dans un contexte d'évaluation des risques liés à l'exposition aux polluants, l'information dont on dispose concernant certains paramètres est souvent de nature imprécise. Le calage d'une distribution de probabilité unique sur ce type de
connaissance devient subjectif et en partie arbitraire.

L'information dont on dispose réellement est souvent plus riche qu'un intervalle mais moins riche qu'une distribution de probabilité. En pratique, l'information de nature aléatoire est traitée de manière rigoureuse par les distributions de probabilité classiques. Celle de nature imprécise est traitée de manière rigoureuse par des familles de distributions de probabilité définies au moyen de paires de probabilités cumulées hautes et basses ou, à l'aide de théories plus récentes, au moyen de distributions de possibilité (aussi appelées intervalles flous) ou encore au moyen d'intervalles aléatoires utilisant les fonctions de croyance de Dempster-Shafer.

Un des premiers objectifs de ce travail est de promouvoir la cohérence entre la manière dont on représente la connaissance sur les paramètres
des modèles du risque et la connaissance dont on dispose réellement. Le deuxième objectif est de proposer différentes méthodes pour propager l'information de nature aléatoire et l'information de nature imprécise à travers les modèles du risque tout en essayant de tenir compte des dépendances entre les paramètres. Enfin, ces méthodes alternatives ont été testées sur des cas synthétiques puis sur des cas réels simplifiés, notamment pour proposer des moyens de présenter les résultats pour une phase décisionnelle:
- Calcul de dose : Transfert d'un polluant radioactif (le strontium) depuis le dépôt jusqu'à
l'homme, au travers de la consommation d'un aliment (le lait de vache).
- Risque toxique après un déversement accidentel de trichloréthylène (TCE) au dessus d'une nappe d'eau (modèle semi analytique).

- Risque pour la santé liée aux sols pollués par des retombées de plomb.
Fichier principal
Vignette du fichier
manuscrit_these.pdf (3.88 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00011933 , version 1 (13-03-2006)

Identifiants

  • HAL Id : tel-00011933 , version 1

Citer

Cédric Baudrit. Représentation et propagation de connaissances imprécises et incertaines: Application à l'évaluation des risques liés aux sites et sols pollués.. Interface homme-machine [cs.HC]. Université Paul Sabatier - Toulouse III, 2005. Français. ⟨NNT : 2005TOU30104⟩. ⟨tel-00011933⟩
1030 Consultations
1010 Téléchargements

Partager

Gmail Facebook X LinkedIn More