Modélisation et manipulation des systèmes OLAP : de l'intégration des documents à l'usager - TEL - Thèses en ligne Accéder directement au contenu
Hdr Année : 2009

Modélisation et manipulation des systèmes OLAP : de l'intégration des documents à l'usager

Résumé

Les travaux de recherches présentés dans ce mémoire proposent des solutions en matière de modélisation et de manipulation des données au sein des systèmes OLAP. Ils s’articulent selon trois axes principaux : − l’axe 1 traite de la modélisation des bases de données multidimensionnelles et de la manipulation OLAP, − l’axe 2 s’attache à intégrer des documents dans les systèmes OLAP, − l’axe 3 vise à personnaliser le système OLAP par la prise en compte de l’expertise décisionnelle et des préférences de l’usager. Axe 1 : Ces travaux visent à définir des modèles de représentation des données décisionnelles ainsi que des langages de manipulation supportant efficacement les analyses. Ces travaux ont abouti à la définition d’un modèle conceptuel spécialisé dans la représentation des données multidimensionnelles. Associé aux concepts, nous avons proposé un formalisme graphique permettant une description simple du schéma en constellation d’une BDM. L’objectif a été de constituer dès 2001 une représentation uniforme et complète des différents concepts partiellement décrits dans les propositions qui existaient en distinguant clairement les niveaux d’abstraction. Ces travaux sur la modélisation ont servi de socle à l’élaboration d’une algèbre OLA]. Ces travaux ont abouti à la définition d’un noyau algébrique minimum fermé d’opérateurs élémentaires assurant la couverture du modèle multidimensionnel. Ce fondement théorique a servi de support pour la définition du langage assertionnel OLAPSQL supportant toutes les fonctionnalités nécessaires aux décideurs : définition, manipulation et interrogation une BDM, et la définition d‘un langage graphique d’interrogation complet au regard de notre algèbre OLAP. Le prototype GRAPHIC-OLAP a été développé pour servir de plateforme expérimentaleAxe 2 : Ces travaux ont pour objectif de rendre possible l’analyse OLAP sur des documents. Le résultat de ces travaux a été de rendre possible non seulement des analyses quantitatives sur le contenu numérique des documents mais également des analyses plus qualitatives sur le contenu textuel des documents. Ces travaux ont abouti à la redéfinition de modèles de représentation des documents dans un espace multidimensionnel. La principale contribution on est la définition du modèle en galaxie. Ce modèle en galaxie repose sur plusieurs idées originales : − L’unicité du mécanisme de description des données analysées décrivant de manière symétrique les sujets et les axes de l’analyse. Cette flexibilité simplifie la définition de la BDM pour le concepteur ; − Le support de mesures textuelles permettant de faire porter les analyses non seulement sur les données numériques mais également sur les données textuelles ; − L’intégration de liens navigationnels sur les données pouvant servir à analyser les relations entre les documents. Nos travaux ont montré la nécessité de généraliser l’algèbre OLAP à la galaxie. La contribution la plus remarquable de ces travaux concerne le développement d’une nouvelle approche pour l’agrégation de données textuelles. Ces travaux ont permis de développer deux fonctions d’agrégation : TOP_KWk exploite la fonction de pondération tf.idf issue de la recherche d’information et permet d’agréger les valeurs des mesures textuelles brutes lors de l’analyse OLAP ; AVG_KW repose sur une ontologie légère de domaine et s’attache à rendre possible l’agrégation de mesures textuelles élaborées (données extraites des documents telles que les mots-clefs). Axe 3 : Il s’agit dans un premier temps de rendre disponible et accessible toute information ayant permis d’aboutir à une décision. Dans un deuxième temps, nous souhaitons mieux prendre en compte les préférences de l’usager en termes de données. Ces travaux ont abouti à un premier résultat reposant sur le concept de mémoire d’expertise afin de conserver le patrimoine immatériel des décideurs au sein du système OLAP. En effet, l’information utile lors du processus d’analyse décisionnelle ne se trouve pas uniquement dans les bases de données multidimensionnelles, mais une partie importante est habituellement immatérielle : il s’agit de « l’expertise » du décideur. Nous avons proposé de modéliser sous la forme d’annotations ancrées dans la base de données multidimensionnelles toutes ces informations immatérielles relevant de l’expertise de l’usager décideur (commentaires, discussions, prises de décision…). Nous avons complété cette approche par la définition de modèles de préférence pour mieux représenter les besoins de l’usager en matière de données analysées. Ces travaux reposent sur deux approches complémentaires : l’approche quantitative et l’approche qualitative. L’approche quantitative consiste à représenter l’intérêt pour l’usager d’une propriété de la constellation par une pondération. Nous avons proposé de définir les préférences de manière contextuelle par un mécanisme de type ECA. Cette approche de préférence contextuelle exprimée quantitativement est facilement utilisable par le système OLAP. L’approche qualitative représentant les préférences de l’usager par une relation d’ordre exprimée sur les données. Ces préférences sont alors simplement définies les unes par rapport aux autres. Nous avons représenté son contexte d’analyse pour déterminer durant l’analyse les préférences relevant de l’analyse en cours. Cette « contextualisation » des préférences permet lors des manipulations OLAP des recommandations contextuelles qui assistent l’usager dans son exploration de l’espace multidimensionnel. L’assistance que nous proposons consiste à recommander à l’usager : des enrichissements de sa requête pour compléter le résultat qu’il cherche, des requêtes anticipées pour obtenir plus directement le résultat attendu, et des requêtes alternatives auxquelles il ne pense pas. Nos recherches montrent que l’approche quantitative facilite les traitements mais rend l’acquisition des préférences difficile tandis que l’approche qualitative simplifie l’acquisition des préférences au détriment de traitements plus couteux.
Fichier principal
Vignette du fichier
2009_HDR_OT.pdf (3.81 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00479460 , version 1 (30-04-2010)
tel-00479460 , version 2 (05-02-2017)

Identifiants

  • HAL Id : tel-00479460 , version 2

Citer

Olivier Teste. Modélisation et manipulation des systèmes OLAP : de l'intégration des documents à l'usager. Base de données [cs.DB]. Université de toulouse, 2009. ⟨tel-00479460v2⟩
955 Consultations
6525 Téléchargements

Partager

Gmail Facebook X LinkedIn More