Spatially Integrated Abstraction of Genetic Molecules - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

Spatially Integrated Abstraction of Genetic Molecules

Abstraction spatiale intégrée de molécules génétiques

Résumé

The human genome consists mainly of DNA, a macromolecule consisting of a long linear sequence of bases, tightly packed to fit in the relatively small nucleus. The packing gives rise to multiple hierarchical organizational levels. Recent research has shown that, along with the linear sequence, the spatial arrangement of the genome plays an important role in the genome’s function and activity. The visualization of both linear and spatial aspects of genome data is therefore necessary. In this thesis, we focus on the concept of continuous visual abstraction for multiscale data, applied to the visualization of the human genome. Visual abstraction is a concept inspired by illustrations that makes the job of visual processing simpler, by guiding the attention of the viewer to important aspects. We first extract characteristics of multiscale data and makes a parallel comparison between genome and astronomical data. The existing differences create the need for different approaches. A common point however is the need for continuous transitions that helps viewers grasp the relationships and relative size differences between scales. To satisfy the conditions posed by the two aspects of the multiscale genome data, we present two conceptual frameworks, based on the same data. The first framework, ScaleTrotter, represents the spatial structure of the genome, on all available levels. It gives users the freedom to travel from the nucleus of a cell to the atoms of the bases, passing through the different organizational levels of the genome. To make the exploration of the structure of all levels possible, smooth temporal transitions are used. Even though all the scales are not simultaneously visible, the temporal transition used superimposes two representations of the same element at consecutive scales emphasizing their relationship. To ensure the understandability and interactivity of the data, unnecessary parts of the data are abstracted away with the use of a scale-dependent camera. The second framework, Multiscale Unfolding, focuses on aspects that are not visible in ScaleTrotter: the linear sequence and a simultaneous overview of all the organizational levels. The data is straightened to unfold the packing that occurs on several levels in a way that conserves the connectivity between the elements. To represent all the available levels, we use smooth spatial transitions between the levels. These spatial transitions are based on the same concept of the temporal transitions of the previous framework, superimposing scales and emphasizing on their relationship and size difference. We introduce an interaction technique called Multiscale Zliding that allows the exploration of the data and further emphasizes the size differences between the levels. In each framework, one of either linear of spatial aspect of genome data is sacrificed to emphasize the other. The thesis concludes with a discussion about the possibility of combining the two frameworks, minimizing the sacrifices to explore the two equally important aspects of the genome. In this thesis, we take a step closer to fully understanding the activity of the genome.
Le génome humain est principalement constitué d'ADN, une macromolécule constituée d'une longue séquence linéaire de bases, étroitement serrée pour s'insérer dans le noyau relativement petit. L'empaquetage donne lieu à de multiples niveaux hiérarchiques d'organisation. Des recherches récentes ont montré que, parallèlement à la séquence linéaire, l'agencement spatial du génome joue un rôle important dans la fonction et l'activité du génome. La visualisation des aspects li-né-aires et spatiaux des données du génome est donc nécessaire. Dans cette thèse, nous nous concentrons sur le concept d'abstraction visuelle continue pour les données multi-échelles, appliqué à la visualisation du génome humain. L'abstraction visuelle est un concept inspiré par des illustrations qui simplifie le travail de traitement visuel, en guidant l'attention du spectateur vers les aspects importants.Nous commençons par extraire les caractéristiques des données multi-échelles et faisons une comparaison parallèle entre le génome et les données astronomiques. Les différences existantes créent le besoin d'approches différentes. Un point commun cependant est la nécessité de transitions continues qui aident les spectateurs à saisir les relations et les différences de taille relative entre les échelles. Pour satisfaire aux conditions posées par les deux aspects des données génomiques multi-échelles, nous présentons deux cadres conceptuels, basés sur les mêmes données. Le premier cadre, ScaleTrotter, représente la structure spatiale du génome, à tous les niveaux disponibles. Il donne à l'utilisateur la liberté de voyager du noyau d'une cellule aux atomes des bases, en passant par les différents niveaux d'organisation du génome. Pour rendre possible l'exploration de la structure de tous les niveaux, des transitions temporelles fluides sont utilisées. Même si toutes les échelles ne sont pas visibles simultanément, la transition temporelle utilisée superpose deux représentations d'un même élément à des échelles consécutives, ce qui met en évidence leur relation. Pour garantir la compréhensibilité et l'interactivité des données, les parties inutiles des données sont extraites à l'aide d'une caméra dépendante de l'échelle. Le deuxième cadre, Multiscale Unfolding, se concentre sur des aspects qui ne sont pas visibles dans ScaleTrotter : la séquence linéaire et une vue d'ensemble simultanée de tous les niveaux organisationnels. Les données sont redressées pour déplier l’empaquetage qui se produit à plusieurs niveaux de manière à conserver la connectivité entre les éléments. Pour représenter tous les niveaux disponibles, nous utilisons des transitions spatiales douces entre les niveaux. Ces transitions spatiales sont basées sur le même concept que les transitions temporelles du cadre précédent, en superposant les échelles et en mettant l'accent sur leur relation et leur différence de taille. Nous introduisons une technique d'interaction appelée Multiscale Zliding qui permet l'exploration des données et met davantage l'accent sur les différences de taille entre les niveaux. Dans chaque cadre conceptuel, l'un des deux aspects linéaire ou spatial des données sur le génome est sacrifié pour mettre l'accent sur l'autre. La thèse se termine par une discussion sur la possibilité de combiner les deux cadres, en minimisant les sacrifices pour explorer les deux aspects du génome qui sont d'égale importance. Dans cette thèse, nous faisons un pas de plus vers la compréhension complète de l'activité du génome.
Fichier principal
Vignette du fichier
94804_HALLADJIAN_2020_archivage.pdf (58.03 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03177653 , version 1 (23-03-2021)

Identifiants

  • HAL Id : tel-03177653 , version 1

Citer

Sarkis Halladjian. Spatially Integrated Abstraction of Genetic Molecules. Human-Computer Interaction [cs.HC]. Université Paris-Saclay, 2020. English. ⟨NNT : 2020UPASG056⟩. ⟨tel-03177653⟩
155 Consultations
25 Téléchargements

Partager

Gmail Facebook X LinkedIn More