De la recherche de granules documentaires à l'agrégation d'information

Abstract : L'expansion du Web depuis la fin des années 90 a modifié en profondeur le fonctionnement des Systèmes de Recherche d'Information (SRI). Côté documents, des données sons, images et vidéos sont venues s'ajouter au texte traditionnellement traité par les SRI. Le texte lui-même s'est transformé, cette mutation étant soutenue par l'expansion des réseaux sociaux et les contenus générés par les utilisateurs. Côté modèles et présentation des résultats, les moteurs de recherche Web, après avoir longtemps proposé aux utilisateurs les fameux 10 liens bleus en réponse à leur requête, incluent maintenant dans leurs pages de résultats des images, des vidéos ou encore des actualités. Lorsque la requête est une entité, un cadre séparé peut également présenter des informations liées. L'idée n'est plus de restituer des documents relatifs à une requête, mais de donner directement à l'utilisateur un aperçu global de l'information liée à son besoin. C'est autour de cette dernière idée que la recherche d'information agrégée a été définie dès 2008, avec pour but de chercher et d'assembler dans une seule interface de l'information utile sous forme de granules d'information provenant d'une ou plusieurs sources. Dans ce cadre, mes recherches se sont plus particulièrement orientées vers: - la recherche de granules d'information. Cet axe porte sur des questions de Recherche d'Information adhoc classique relatives à la sélection de granules pertinents répondant à une requête. Nous avons considéré trois sources d'information spécifiques: (i) les collections de documents semi-structurés de type XML, afin de retrouver des granules textuels ou image; (ii) les plateformes de microblogging de type Twitter, nécessitant un traitement temps-réel des informations; (iii) le Web, pour des problématiques liées aux requêtes de type entité (recherche de relations autour de l'entités et d'informations nouvelles la concernant). - l'agrégation des résultats. Plus particulièrement, nous avons travaillé sur l'agrégation des relations liées à des entités, ainsi que sur le résumé temporel d'informations provenant de documents pertinents autour des entités. Enfin, une dernière partie de mes travaux concerne de façon transverse l'évaluation des systèmes, à travers le montage de collections de test ou la définition de protocoles d'évaluation.
Document type :
Habilitation à diriger des recherches
Complete list of metadatas

Cited literature [360 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01865051
Contributor : Karen Pinel-Sauvagnat <>
Submitted on : Thursday, August 30, 2018 - 5:06:06 PM
Last modification on : Thursday, October 24, 2019 - 2:44:07 PM

File

2018_HDR_PS.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-01865051, version 1

Collections

Citation

Karen Pinel-Sauvagnat. De la recherche de granules documentaires à l'agrégation d'information. Recherche d'information [cs.IR]. Université Paul Sabatier (Toulouse 3), 2018. ⟨tel-01865051⟩

Share

Metrics

Record views

136

Files downloads

271