Entrepôts de données pour l'aide à la décision médicale: conception et expérimentation - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2005

Data warehouses in a medical environment: design and experimentation

Entrepôts de données pour l'aide à la décision médicale: conception et expérimentation

Résumé

Data warehouses integrate information coming from different data sources which are often heterogeneous and distributed. Their main goal is to provide a global view for analysts and managers to make decisions based on data sets and historical logs. The design and construction of a data warehouse are composed by three phases: extraction-integration, organisation and interrogation. In this thesis, we are interested in the latter two. For us, the organisation is a complex and delicate task. Hence, we divide it into two parts: data structuring and data managing. For structuring we propose a multidimensional model which is composed by three classes: Cube, Dimension and Hierarchy. We propose also an algorithm for selecting the optimal set of materialized views. We consider that data management should include warehouse evolution. The concept of schema evolution was adapted here and we propose to use bitemporal schema versions for the management, storage and visualization of current and historical data (intentional and extensional). Finally, we have implemented a graphic interface that allows semi-automatic query generation (indicators). These queries (for example, 'number of patients by hospitals and diseases') are determined by the application domain. We had the opportunity to work in a medical project; it allowed us to verify and to validate our proposition using real data.
Les entrepôts de données intègrent les informations en provenance de différentes sources, souvent réparties et hétérogènes et qui ont pour objectif de fournir une vue globale de l'information aux analystes et aux décideurs. L'ensemble des données avec leurs historiques sert pour l'aide à la décision. La conception et la mise en œuvre d'un entrepôt se fait en trois étapes : extraction-intégration, organisation et interrogation. Dans cette thèse, nous nous intéressons aux deux dernières. Pour nous, l'organisation est une tâche complexe et délicate, pour cela, nous la divisons en deux parties : structuration et gestion des données. Ainsi, pour la structuration, nous proposons la définition d'un modèle multidimensionnel qui se compose de trois classes : Cube, Dimension et Hiérarchie. Nous proposons également un algorithme pour la sélection de l'ensemble optimal des vues à matérialiser. La gestion de données doit prendre en compte l'évolution des entrepôts. Le concept d'évolution de schéma a été introduit pour récupérer les données existantes par le biais de leur adaptation au nouveau schéma. Néanmoins, dans les systèmes qui doivent gérer des données historiques, l'évolution de schéma n'est pas suffisante et la maintenance de plusieurs schémas est requise. Pour cela, nous proposons l'utilisation des versions de schémas bitemporels pour la gestion, le stockage et la visualisation des données courantes et historisées (intensionnelles et extensionnelles). Finalement, pour l'interrogation, nous avons développé une interface graphique qui permet la génération (semi-automatique) des indicateurs. Ces indicateurs (par exemple, 'le nombre de séjours par établissement et par maladie') sont déterminés par le cadre applicatif. Nous avons eu l'opportunité de travailler dans le cadre d'un projet médical, ce qui nous a permis de vérifier et de valider notre proposition sur des données réelles.
Fichier principal
Vignette du fichier
These.pdf (1.36 Mo) Télécharger le fichier

Dates et versions

tel-00184256 , version 1 (30-10-2007)

Identifiants

  • HAL Id : tel-00184256 , version 1

Citer

Serna Encinas María Trinidad. Entrepôts de données pour l'aide à la décision médicale: conception et expérimentation. Réseaux et télécommunications [cs.NI]. Université Joseph-Fourier - Grenoble I, 2005. Français. ⟨NNT : ⟩. ⟨tel-00184256⟩

Collections

UGA UJF
499 Consultations
10196 Téléchargements

Partager

Gmail Facebook X LinkedIn More