Modélisation de la pertinence en recherche d'information : modèle conceptuel, formalisation et application - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 1997

Modelling relevance for information retrieval: conceptual model, formalization and application

Modélisation de la pertinence en recherche d'information : modèle conceptuel, formalisation et application

Résumé

Information retrieval systems aim at allowing a user to reach documents that contribute to solve the information problem that prompted the use of the system. The system can be viewed as a predictive apparatus, that predicts the relevance of documents for the user. To do this, systems generally rely on pieces of evidence that are of a topical nature, namely the set of keywords that can be obtained from the query entered by the user. The system implements thus a matching function that maps documents onto queries, and that models the topical dimension of relevance. Although, uses ans users of information retrieval systems are getting more varied, as well as information media that is not exclusively textual anymore. We draw two consequences from these evolutions. Firstly, the assumption that the topical relevance factor is paramount and as such, the only factor actually modelled in systems, does not hold anymore. Many other relevance factors are involved in information retrieval, that greatly influence systems performance in the context of a real-life use of a system. These factors strongly depend on the individual who performs the search, and on the situation in which the individual stands, and this fact requestions the traditional modelling of relevance as a normalizing topical matching between documents and queries. Secondly, the interactive nature of information retrieval system use, contributes to the definition of the user's situation, and as such, participates in the system's overall performance. A number of interactive features in systems are directly concerned with the modelling of relevance and with IR-specific matters -- viz. the number of retrieved documents that the user faces, the precision or exhaustivity of the result, etc. This thesis relies on user relevance studies to define a model for the design of system relevance that accounts for those relevance factors involved in the interactive use of systems, and for the need for adapting the matching function to the particular retrieval situation at hand. Hence, we define three user-oriented functional duties for information retrieval systems: allow for the detection of relevant documents retrieved, allow for the understanding and comprehending of the reasons for documents to be retrieved, and allow for the production of useful feedback for the iterative improvement of the query. The concept of relevance schema substitutes to the traditional query, to play the role of interfaces between the system relevance and the user. This relevance schema is comprised of two kinds of parameters that allow tuning the system in relation with the retrieval situation encountered: on the one hand, semantic parameters encompass the topical dimension together with other types of relevance criteria, and on the other hand, pragmatic parameters account for relevance factors related to the conditions in which the user achieves the interactive tasks required. We apply this design to an image retrieval application, with a multi-faceted indexing available that allow for the definition of relevance criteria that go beyond topical relevance criteria. We show via our prototype how the system can adapt to situations occurring during a retrieval session.
Les systèmes de recherche d'information ont pour fonction de permettre à l'utilisateur d'accéder à des documents qui contribuent à résoudre le problème d'information qui motive sa recherche. Ainsi le système peut être vu comme un instrument de prédiction de la pertinence des documents du corpus pour l'utilisateur. Les indices traditionnellement utilisés par le système pour estimer cette pertinence sont de nature thématique, et sont fournis par l'utilisateur sous la forme d'un ensemble de mots-clés : la requête. Le système implémente donc une fonction de correspondance entre documents et requête qui modélise la dimension thématique de la pertinence. Cependant l'éventail des utilisations et des utilisateurs des systèmes va s'élargissant, de même que la nature des documents présents dans les corpus, qui ne sont plus seulement des documents textuels. Nous tirons deux conséquences de cette évolution. D'une part, l'hypothèse que le facteur thématique de pertinence est prépondérant (et donc seul sujet à modélisation dans les systèmes), ne tient plus. Les autres facteurs, nombreux, de la pertinence interviennent d'une manière telle qu'ils compromettent les performances des systèmes dans le contexte d'une utilisation réelle. Ces autres facteurs dépendent fortement de l'individu et de sa situation de recherche d'information, ce qui remet en cause la conception de la pertinence système comme une fonction de correspondance qui ne prend en compte que les facteurs de la pertinence qui ne dépendent pas de l'utilisateur. D'autre part, la nature de l'utilisation interactive du système contribue à définir la situation de recherche de l'utilisateur, et en cela participe aux performances du système de recherche d'information. Un certain nombre de caractéristiques de l'interaction sont directement liées à la modélisation de la pertinence système et à des préoccupations spécifiques à la problématique de la recherche d'information. Notre thèse s'appuie sur les travaux réalisés sur les facteurs de la pertinence pour un individu, pour définir un modèle de conception de la pertinence système qui prend en compte les facteurs qui relèvent de l'utilisation interactive du système et de la nécessité d'adaptation de la fonction de correspondance à la situation de recherche particulière dans laquelle l'utilisateur se trouve. Ainsi, nous définissons trois nouvelles fonctions du système de recherche d'information, en termes d'utilisation du système : permettre la détection de la pertinence des documents retrouvés, permettre la compréhension des raisons de leur pertinence système, et permettre de procéder à une reformulation du problème d'information dans le cadre d'un processus itératif de recherche. La notion de schéma de pertinence se substitue à celle de requête, en tant qu'interface entre la pertinence système et l'utilisateur. Ce schéma de pertinence intègre deux types de paramètres permettant l'adaptation du système à la situation de recherche : d'une part les paramètres sémantiques, qui recouvrent non seulement la dimension thématique de la pertinence mais aussi d'autres critères de pertinence liés aux caractéristiques indexées des documents, et d'autre part les paramètres pragmatiques qui prennent en compte les facteurs de la pertinence liés aux conditions dans lesquelles l'utilisateur réalise les tâches qui lui incombent dans l'interaction. Nous appliquons ce modèle de conception de la pertinence système dans le cadre d'une application de recherche d'images, dont le corpus est indexé de façon à couvrir plusieurs dimensions de la pertinence outre la dimension thématique. Notre prototype nous permet de montrer comment le système s'adapte en fonction des situations qui se présentent au cours d'une session de recherche.
Fichier principal
Vignette du fichier
tel-00004938.pdf (3.6 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00004938 , version 1 (20-02-2004)

Identifiants

  • HAL Id : tel-00004938 , version 1

Citer

Nathalie Denos. Modélisation de la pertinence en recherche d'information : modèle conceptuel, formalisation et application. Interface homme-machine [cs.HC]. Université Joseph-Fourier - Grenoble I, 1997. Français. ⟨NNT : ⟩. ⟨tel-00004938⟩

Collections

UGA IMAG CNRS UJF
692 Consultations
238 Téléchargements

Partager

Gmail Facebook X LinkedIn More