Data-intensive interactive workflows for visual analytics

Wael Khemiri 1, 2, 3
1 AVIZ - Analysis and Visualization
Inria Saclay - Ile de France
2 LEO - Distributed and heterogeneous data and knowledge
UP11 - Université Paris-Sud - Paris 11, Inria Saclay - Ile de France, CNRS - Centre National de la Recherche Scientifique : UMR8623
Résumé : L'expansion du World Wide Web et la multiplication des sources de données (capteurs, services Web, programmes scientifiques, outils d'analyse, etc.) ont conduit à la prolifération de données hétérogènes et complexes. La phase d'extraction de connaissance et de recherche de corrélation devient ainsi de plus en plus difficile.Typiquement, une telle analyse est effectuée en utilisant les outils logiciels qui combinent: des techniques de visualisation, permettant aux utilisateurs d'avoir une meilleure compréhension des données, et des programmes d'analyse qui effectuent des opérations d'analyses complexes et longues.La visualisation analytique (visual analytics) vise à combiner la visualisation des donnéesavec des tâches d'analyse et de fouille. Etant donnée la complexité et la volumétrie importante des données scientifiques (par exemple, les données associées à des processus biologiques ou physiques, données des réseaux sociaux, etc.), la visualisation analytique est appelée à jouer un rôle important dans la gestion des données scientifiques.La plupart des plateformes de visualisation analytique actuelles utilisent des mécanismes en mémoire centrale pour le stockage et le traitement des données, ce qui limite le volume de données traitées. En outre, l'intégration de nouveaux algorithmes dans le processus de traitement nécessite du code d'intégration ad-hoc. Enfin, les plate-formes de visualisation actuelles ne permettent pas de définir et de déployer des processus structurés, où les utilisateurs partagent les données et, éventuellement, les visualisations.Ce travail, à la confluence des domaines de la visualisation analytique interactive et des bases de données, apporte deux contributions. (i) Nous proposons une architecture générique pour déployer une plate-forme de visualisation analytique au-dessus d'un système de gestion de bases de données (SGBD). (ii) Nous montrons comment propager les changements des données dans le SGBD, au travers des processus et des visualisations qui en font partie. Notre approche permet à l'application de visualisation analytique de profiter du stockage robuste et du déploiement automatique de processus à partir d'une spécification déclarative, supportés par le SGBD.Notre approche a été implantée dans un prototype appelé EdiFlow, et validée à travers plusieurs applications. Elle pourrait aussi s'intégrer dans une plate-forme de workflow scientifique à usage intensif de données, afin d'en augmenter les fonctionnalités de visualisation.
Type de document :
Thèse
Other [cs.OH]. Université Paris Sud - Paris XI, 2011. English. <NNT : 2011PA112345>
Liste complète des métadonnées


https://tel.archives-ouvertes.fr/tel-00659227
Contributeur : Abes Star <>
Soumis le : jeudi 12 janvier 2012 - 13:02:27
Dernière modification le : jeudi 9 février 2017 - 15:59:48
Document(s) archivé(s) le : vendredi 13 avril 2012 - 02:26:15

Fichier

VA2_KHEMIRI_WAEL_04011984.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-00659227, version 1

Collections

Citation

Wael Khemiri. Data-intensive interactive workflows for visual analytics. Other [cs.OH]. Université Paris Sud - Paris XI, 2011. English. <NNT : 2011PA112345>. <tel-00659227>

Partager

Métriques

Consultations de
la notice

730

Téléchargements du document

481