Un modèle d'indexation pour les documents textuels structurés

Résumé : La plupart des modèles d'indexation en recherche d'informations sont spécifiques à une application ou à un domaine particulier, et n'exploitent pas toute la richesse des documents électroniques. Le but de ce travail est de définir un modèle d'indexation pour les documents textuels qui tienne compte de la structure et d'autres informations complémentaires au discours. Le modèle proposé comporte deux composantes : le langage de représentation, qui définit de façon conceptuelle les informations du document, y compris les index eux-mêmes, et les règles de dérivation, qui, reprenant ce langage, permettent de déduire un type particulier d'index, les thèmes. L'indexation dans notre modèle ne se contente pas de produire une représentation statique du document, mais elle est aussi dynamiquement liée au processus de correspondance ; ainsi, le choix des thèmes, tels que déterminés par les règles, est fonction du document et de l'utilisateur. Notre approche a été validée en deux temps. D'abord, un questionnaire a été soumis à un groupe d'utilisateurs afin de cerner leur processus de dérivation de thèmes. Cette validation à priori a permis de démontrer le bien-fondé de nos règles de dérivation. Puis, dans une validation à posteriori, le modèle a été implémenté et testé sur une collection de documents sgml. Cette expérimentation a demontré l'applicabilité et la flexibilité du modèle.
Type de document :
Thèse
Interface homme-machine [cs.HC]. Université Joseph-Fourier - Grenoble I, 1996. Français
Liste complète des métadonnées

Littérature citée [56 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00005009
Contributeur : Thèses Imag <>
Soumis le : lundi 23 février 2004 - 17:11:04
Dernière modification le : lundi 23 février 2004 - 17:11:04
Document(s) archivé(s) le : vendredi 14 septembre 2012 - 10:40:44

Identifiants

  • HAL Id : tel-00005009, version 1

Collections

UJF | IMAG | UGA

Citation

Francois Paradis. Un modèle d'indexation pour les documents textuels structurés. Interface homme-machine [cs.HC]. Université Joseph-Fourier - Grenoble I, 1996. Français. 〈tel-00005009〉

Partager

Métriques

Consultations de
la notice

747

Téléchargements du document

440