Reformulation sémantique des requêtes pour la recherche d’information ad hoc sur le Web

Résumé : Dans le cadre d’une solution de modification de la requête, nous nous intéressons aux différentes façons d’utiliser la sémantique pour mieux exprimer le besoin d’information de l’utilisateur dans un contexte Web. Nous distinguons deux types de concepts : ceux identifiables dans une ressource sémantique comme une ontologie, et ceux que l’on extrait à partir d’un ensemble de documents de pseudo retour de pertinence. Nous proposons une Approche Sémantique Mixte d’Expansion et de Reformulation (ASMER) qui permet de modéliser l’utilisation de ces deux types de concepts dans une requête modifiée. Cette approche considère plusieurs défis liés à la modification automatique des requêtes, notamment le choix sélectif des termes d’expansion, le traitement des entités nommées et la reformulation de la requête finale.Bien que dans un contexte Web la précision soit le critère d’évaluation le plus adapté, nous avons aussi pris en compte le rappel pour étudier le comportement de notre approche sous plusieurs aspects. Ce choix a suscité une autre problématique liée à l’évaluation du rappel en recherche d’information. En constatant que les mesures précédentes ne répondent pas à nos contraintes, nous avons proposé la mesure MOR (Mesure Orientée Rappel), qui permet d’évaluer le rappel en tenant compte de la précision comme importante mais pas prioritaire dans un contexte dirigé rappel.En incluant MOR dans notre stratégie de test, nous avons évalué ASMER sur quatre collections Web issues des campagnes INEX et TREC. Nos expériences montrent qu’ASMER améliore la performance en précision par rapport aux requêtes originales et par rapport aux requêtes étendues par une méthode de l’état de l’art.
Type de document :
Thèse
Autre. Ecole Nationale Supérieure des Mines de Saint-Etienne, 2014. Français. <NNT : 2014EMSE0750>
Liste complète des métadonnées


https://tel.archives-ouvertes.fr/tel-01126932
Contributeur : Abes Star <>
Soumis le : vendredi 6 mars 2015 - 22:59:16
Dernière modification le : jeudi 29 juin 2017 - 12:49:09
Document(s) archivé(s) le : dimanche 7 juin 2015 - 19:40:24

Fichier

2014EMSE0750.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01126932, version 1

Collections

Citation

Bissan Audeh. Reformulation sémantique des requêtes pour la recherche d’information ad hoc sur le Web. Autre. Ecole Nationale Supérieure des Mines de Saint-Etienne, 2014. Français. <NNT : 2014EMSE0750>. <tel-01126932>

Partager

Métriques

Consultations de
la notice

563

Téléchargements du document

1859