Utilisation d'ontologies comme support à la recherche et à la navigation dans une collection de documents - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2012

Utilisation d'ontologies comme support à la recherche et à la navigation dans une collection de documents

Résumé

Domain ontologies provide conceptual formalization of domain knowledge. One contribution of this study consists in using them in conceptual Information Retrieval Systems (IRS), in particular to assess the relevance of documents with respect to a given query. For this matching process a model is proposed that incorporates both user preferences and semantic similarity measures attached to domain ontology. Our approach allows justifying the relevance of the results to the user, using visualization tools. As Information Retrieval is an iterative process, users may be involved in the control loop of the results relevancy to better specify their information needs. We propose to formalize ontology based relevance feedback using an objective function and a heuristic that efficiently builds a near optimal query. These approaches have been validated in two ways: automatic assessment based on standard collections of tests, and case studies involving experts from biomedical domain.
Les ontologies modélisent la connaissance d'un domaine avec une hiérarchie de concepts. Cette thèse porte sur leur utilisation dans les Systèmes de Recherche d'Information (SRI) pour estimer la pertinence des documents par rapport à une requête. Nous calculons cette pertinence à l'aide d'un modèle des préférences de l'utilisateur et d'une mesure de similarité sémantique associée à l'ontologie. Cette approche permet d'expliquer à l'utilisateur pourquoi les documents sélectionnés sont pertinents grâce à une visualisation originale. La RI étant un processus itératif, l'utilisateur doit être guidé dans sa reformulation de requête. Une stratégie de reformulation de requêtes conceptuelles est formalisée en un problème d'optimisation utilisant les retours faits par l'utilisateur sur les premiers résultats proposés comme base d'apprentissage. Nos modèles sont validés sur la base de performances obtenues sur des jeux de tests standards et de cas d'études impliquant des experts biologistes.
Fichier principal
Vignette du fichier
TheseMohamethFrancoisSY_UMII.pdf (5.57 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00822516 , version 1 (14-05-2013)

Identifiants

  • HAL Id : tel-00822516 , version 1

Citer

Mohameth-François Sy. Utilisation d'ontologies comme support à la recherche et à la navigation dans une collection de documents. Recherche d'information [cs.IR]. Université Montpellier II - Sciences et Techniques du Languedoc, 2012. Français. ⟨NNT : ⟩. ⟨tel-00822516⟩
271 Consultations
1116 Téléchargements

Partager

Gmail Facebook X LinkedIn More