Propositions pour la représentation et l'analyse de documents numériques - TEL - Thèses en ligne Accéder directement au contenu
Hdr Année : 2006

Proposition for the representation and the analysis of digital documents

Propositions pour la représentation et l'analyse de documents numériques

Résumé

The research works presented in this document deal simultaneously with document images analysis and human-computer interaction. In both subjects, electronic documents could be seen as collection of elementary objects gathered on a physical support (support level). At a higher level, it is also possible to be interested in the relations and in the links between the different elements of content constituting the documents (structure level). Finally, the sense or the message carried by the document should not be ignored when we try to analyse its content regarding as well the images as the interfaces (semantic level). Three main problematics are developed by using this three level structure. The first one concerns the construction of representations for the description of the content of the document images and of on-line strokes. Different algorithms for the automatic construction of these representations starting with the data provided by the acquisition devices (images for off-line documents and set of ordered points for on-line documents) are discussed. Next, the analysis strategies and recognition methods available to work on such representations in order to achieve the interpretation of the contents of the documents are presented. Finally, we explain how the three level structure of the electronic documents can be exploited in order to generate adaptive interfaces. The objective is to format and display the information needed by the end users according to their profile in particular when they are using hyperdocuments during e-learning sessions. In all the cases a particular attention is turned to the modelling of the data and processing to obtain generic frameworks.
Les travaux présentés dans ce document concernent à la fois l’analyse et la reconnaissance d’images de documents et les interfaces homme-document multimédia. Les documents numériques peuvent être vus, dans les deux cas, comme un assemblage d’objets élémentaires sur un support physique (niveau support). A un niveau légèrement plus élevé, il est également possible de s’intéresser à l’enchaînement et aux liens existants entre les différents éléments de contenus d’un document (niveau structure). Enfin, le sens ou le message véhiculé par le document (niveau sémantique) ne doit pas être négligé lorsque l’on cherche à analyser son contenu qu’il s’agisse d’une image ou d’une interface. Trois problématiques principales sont développées en partant de cette vision commune. La première traite de la mise en place de représentations abstraites permettant de décrire le contenu des images de documents et des tracés en ligne. Différents algorithmes de construction automatique de ces représentations abstraites à partir des données directement fournies par les dispositifs d’acquisition en hors ligne (images) et en ligne (suite de points horodatés) sont présentés. Ensuite, différentes architectures d’analyse et méthodes de reconnaissance utilisables sur ces représentations sont proposés pour effectuer l’interprétation du contenu des documents. Enfin, la structuration en trois niveaux des documents numériques est à nouveau exploitée pour produire des interfaces adaptatives de façon à mieux pouvoir formater et présenter les informations demandées par les utilisateurs notamment lorsque ces derniers utilisent des hyperdocuments dans le cadre du télé-enseignement. A chaque fois, une attention particulière est portée sur la modélisation des données et des traitements de manière à obtenir des environnements suffisamment génériques.
Fichier principal
Vignette du fichier
HDR_JY_vf.PDF (5.78 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01075984 , version 1 (20-10-2014)

Identifiants

  • HAL Id : tel-01075984 , version 1

Citer

Jean-Yves Ramel. Propositions pour la représentation et l'analyse de documents numériques. Traitement du texte et du document. Université Francois Rabelais de Tours, 2006. ⟨tel-01075984⟩
217 Consultations
828 Téléchargements

Partager

Gmail Facebook X LinkedIn More