Génération de documents virtuels par intégration de relations entre documents structurés pour la recherche d'information - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2008

Génération de documents virtuels par intégration de relations entre documents structurés pour la recherche d'information

Delphine Verbyst
  • Fonction : Auteur
  • PersonId : 932436

Résumé

Information retrieval on structured documents attempts to answer in a precise way to a user request by providing only elements of documents (doxels) that satis es this need for information. This thesis investigates the characterization of relations (structural and non-structural) between parts of structured documents in this context. We model structured documents indexing using the structure and relations between doxels and we characterize these relations by relative exhaustivity and speci city values. The querying process based on these structured documents generates virtual documents as results, indicating the relevant links between doxels. The model is validated through the evaluation campaign INEX 2007 data (660 000 documents Wikipedia, 100 requests) and the results show an improvement of 24% in average precision with the vector space model.
La recherche d'information sur des documents structurés tente de répondre de manière cibl ée à une requête utilisateur en ne fournissant que des éléments de documents (doxels) pour satisfaire ce besoin d'information. Ce travail de thèse étudie l'apport de la caractérisation des relations (structurelles et non structurelles) entre parties de documents structurés dans ce contexte. Nous modélisons l'indexation des documents structurés en utilisant la structure et les relations entre doxels et nous caractérisons ces relations par des valeurs d'exhaustivité et de spéci cité relatives. Le processus de recherche basé sur ces documents structurés génère des documents virtuels résultats, en spéci ant les liens pertinents entre les doxels. Le modèle est validé par des expérimentations sur la campagne d'évaluation INEX 2007 (660 000 documents Wikipedia, 100 requêtes) et les résultats obtenus montrent une amélioration de 24% en précision moyenne avec le modèle vectoriel.
Fichier principal
Vignette du fichier
theseDelf.pdf (2.58 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00749755 , version 1 (08-11-2012)

Identifiants

  • HAL Id : tel-00749755 , version 1

Citer

Delphine Verbyst. Génération de documents virtuels par intégration de relations entre documents structurés pour la recherche d'information. Recherche d'information [cs.IR]. Université Joseph-Fourier - Grenoble I, 2008. Français. ⟨NNT : ⟩. ⟨tel-00749755⟩
145 Consultations
193 Téléchargements

Partager

Gmail Facebook X LinkedIn More